Skip to content

Create kth_largest_element_in_a_straem.md #10

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
wants to merge 3 commits into
base: main
Choose a base branch
from
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
110 changes: 110 additions & 0 deletions kth_largest_element_in_a_straem.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,110 @@
# 703. Kth longest elements
問題文:https://leetcode.com/problems/kth-largest-element-in-a-stream/description/
次に解く:https://leetcode.com/problems/top-k-frequent-elements/description/

## 参考にした方々(Pythonで書かれた直近5名)
- https://github.com/rinost081/LeetCode/pull/9/files
- https://github.com/t0hsumi/leetcode/pull/8/files
- https://github.com/frinfo702/software-engineering-association/pull/11/files
- https://github.com/ichika0615/arai60/pull/8/files
- https://github.com/olsen-blue/Arai60/pull/8/files

## Step 1
### 考えたこと
- まずはリストとsorted関数で実装してみるも、入力のaddが多い時に計算時間に引っかかる。
- Kとnがどっちも10^4くらいあるし、O(nk)=O(n^2)オーダーになってるからはみ出すのかな

※下は動きません
```Python
# @lc code=start
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.k = k
self.nums = nums

def add(self, val: int) -> int:
self.nums.append(val)
sorted_nums = sorted(self.nums)

kth_largest = sorted_nums[-self.k]

return kth_largest
```
- 答えを見ると計算量がO(nlogn)になる様にheapを使うのが普通らしいのでこれを真似してみる。
- 問題的にはいいんだけど、numにaddされた後のリストとか保存しておかなくていいのかな…?

```Python
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.k = k
self.nums = nums
heapq.heapify(self.nums)

while len(self.nums) > k:
heapq.heappop(self.nums)

def add(self, val: int) -> int:
heapq.heappush(self.nums, val)

if len(self.nums) > self.k:
heapq.heappop(self.nums)
kth_largest = self.nums[0]

return kth_largest
```


## Step 2
### 学んだこと
- self.nums=numsとしてもミュータブルなリストは参照渡しされるのか…。copy()しておこう:https://github.com/frinfo702/software-engineering-association/pull/11/files
- 読んだことないならheapの公式ドキュメントは読んでおこうとのこと(nlargestとかあるな):https://docs.python.org/3/library/heapq.html#heapq.heappushpop
- Heapifyする代わりにaddで回すのは読みやすくて行数も短いので確かに良さそう。
- top_k_heapはわかりやすいので頂戴しよう
- Heapを知らない自分でも解ける方法はあったのか…:https://github.com/rinost081/LeetCode/pull/9/files のstep1
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

k 個取っておくようにすれば間に合いましたね。sorted array は意外と速いです。insort も参考にどうぞ。
https://docs.python.org/3/library/bisect.html#bisect.insort_right

Copy link
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

sortの順番を崩さずに挿入する関数があるんですね、頭に入れておきます。

- sort()は破壊的処理をするのでNoneが帰ってくる:¶
- し、Noneが帰ってくるのもユーザーに気づかせるためだったのか、すごく考えられてて少し感動
- 「シーケンスをインプレースに変化させます」等の意味がすぐに取れないから日本語ですら公式ドキュメントを敬遠してしまってるのだとわかる。
- While使うよりこれの方が良さそう(step1では回答を真似したが、最初はこういうセンスで書こうとしたので、受け入れやすくもある):https://github.com/rinost081/LeetCode/pull/9/files#r1874734978
- 言語ごとの処理速度の差:https://github.com/ichika0615/arai60/pull/8/files#r1898337850

```Python
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.k = k
self.nums = []

for num in nums:
self.add(num)

def add(self, val: int) -> int:
heapq.heappush(self.nums, val)

if len(self.nums) > self.k:
heapq.heappop(self.nums)

return self.nums[0]
```

## Step 3
### コメント

- この書き方だと’add’という関数名が微妙に実態からずれて気もする(k番目の値より小さい要素を削ったりしているので)けど、問題文でaddと指定されているのでよしとしよう
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

言われてみればそうですね
実際に使うのであれば破壊的処理をしているのでNoneを返すほうが親切ですね

- 変数名をtop_k_valueにしただけで今何をしているのかわかりやすくなり、コードが格段に頭に入りやすくなる現象を確認しておもしろい
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

変数名をtop_k_valueにしただけで今何をしているのかわかりやすくなり、コードが格段に頭に入りやすくなる現象を確認しておもしろい

これ大事ですね。

- 1回目:3m27sec, 2回目:3min10sec, 3回目:1min49sec

```Python
class KthLargest:
def __init__(self, k: int, nums: List[int]):
self.k = k
self.top_k_value = []
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

細かいですが、top_k_valuesの方が適切だと思います。

Copy link
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

確かにそうですね。前もご指摘いただいたのでもう少し気を使います。


for num in nums:
self.add(num)

def add(self, val: int) -> int:
heapq.heappush(self.top_k_value, val)

if len(self.top_k_value) > self.k:
heapq.heappop(self.top_k_value)

return self.top_k_value[0]
```