-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathatom.xml
392 lines (215 loc) · 16.8 KB
/
atom.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title>Henry's Blog</title>
<subtitle>用简单的话把事情讲明白</subtitle>
<link href="https://hzhu212.github.io/atom.xml" rel="self"/>
<link href="https://hzhu212.github.io/"/>
<updated>2025-04-07T08:24:25.127Z</updated>
<id>https://hzhu212.github.io/</id>
<author>
<name>Henry</name>
</author>
<generator uri="https://hexo.io/">Hexo</generator>
<entry>
<title>一文理解贝叶斯推断</title>
<link href="https://hzhu212.github.io/posts/c3c9529b/"/>
<id>https://hzhu212.github.io/posts/c3c9529b/</id>
<published>2025-04-07T06:47:50.000Z</published>
<updated>2025-04-07T08:24:25.127Z</updated>
<summary type="html"><p>贝叶斯推断是基于贝叶斯定理的一种推断方法,与之相关的最大似然估计、最大后验估计等统计推断方法是机器学习中的核心概念。本文尝试从一个简单的例子入手,帮助读者深入理解这些复杂的概念。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="概率统计" scheme="https://hzhu212.github.io/tags/%E6%A6%82%E7%8E%87%E7%BB%9F%E8%AE%A1/"/>
</entry>
<entry>
<title>关于状态机的思考</title>
<link href="https://hzhu212.github.io/posts/3b7dc41d/"/>
<id>https://hzhu212.github.io/posts/3b7dc41d/</id>
<published>2022-11-29T15:40:19.000Z</published>
<updated>2025-04-07T06:10:19.270Z</updated>
<summary type="html"><p>LeetCode 上有这样一道题目:<a href="https://leetcode.cn/problems/biao-shi-shu-zhi-de-zi-fu-chuan-lcof/">表示数值的字符串</a>。题目看似简单,但其最佳解法却蕴含着一种绝妙的工程实践——状态机。</p>
<p>本文从这道编程题目出发,思考了一些状态机的使用场景,记录下脑暴过程。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="算法" scheme="https://hzhu212.github.io/tags/%E7%AE%97%E6%B3%95/"/>
</entry>
<entry>
<title>如何调优一个大型 Flink 任务</title>
<link href="https://hzhu212.github.io/posts/80f3ba16/"/>
<id>https://hzhu212.github.io/posts/80f3ba16/</id>
<published>2022-11-29T15:23:01.000Z</published>
<updated>2025-04-07T06:10:19.270Z</updated>
<summary type="html"><blockquote>
<p>本文<a href="https://developer.volcengine.com/articles/7065250720647708703">首发于火山引擎开发者社区</a>,获得当期社区征文活动一等奖。</p>
</blockquote>
<h1 id="本文目标"><a class="markdownIt-Anchor" href="#本文目标"></a> 本文目标</h1>
<p>随着实时计算的应用越来越广泛,同时实时数仓的概念逐渐深入人心,Flink 作为实时计算领域当之无愧的最优秀框架,其使用范围飞速扩张。对于一个优秀的大数据开发工程师来说,非常有必要熟练掌握 Flink 框架的使用和运维。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="大数据" scheme="https://hzhu212.github.io/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="Flink" scheme="https://hzhu212.github.io/tags/Flink/"/>
<category term="实时数仓" scheme="https://hzhu212.github.io/tags/%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93/"/>
</entry>
<entry>
<title>一文理解 HyperLogLog(HLL) 算法</title>
<link href="https://hzhu212.github.io/posts/365f8e92/"/>
<id>https://hzhu212.github.io/posts/365f8e92/</id>
<published>2022-11-29T14:26:28.000Z</published>
<updated>2025-04-07T06:10:19.269Z</updated>
<summary type="html"><p>HyperLogLog(HLL) 算法是一种估算海量数据基数的方法,被广泛用于各个数据库产品中。</p>
<p>与精确的基数统计算法相比,HLL 具备可合并性 (mergeability) ,因而可以方便地对海量数据进行并行计算,被广泛地用于大数据多维分析场景中。例如分别统计一款 APP 每个小时的 UV 以及全天的 UV,这类问题就非常适合使用 HLL 算法。</p>
<p>本文将会由浅入深,从基本概念讲起,引导读者从直观上理解 HLL 算法背后蕴含的基本思想。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="数据结构" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/"/>
<category term="数据库" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E5%BA%93/"/>
<category term="大数据" scheme="https://hzhu212.github.io/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
</entry>
<entry>
<title>DataSketches 算法概述</title>
<link href="https://hzhu212.github.io/posts/b4f47739/"/>
<id>https://hzhu212.github.io/posts/b4f47739/</id>
<published>2022-11-29T14:02:08.000Z</published>
<updated>2025-04-07T06:10:19.268Z</updated>
<summary type="html"><p>在数据领域,有几类经典的查询场景,这些查询在小数据量下很容易做到,但一旦数据量扩大传统思路将变得不可行,必须采用特定的数据结构与算法来支持,这就是今天要讨论的 DataSketches 算法族。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="数据结构" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/"/>
<category term="数据库" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E5%BA%93/"/>
<category term="大数据" scheme="https://hzhu212.github.io/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
</entry>
<entry>
<title>一文理解Python导入机制</title>
<link href="https://hzhu212.github.io/posts/b9859a94/"/>
<id>https://hzhu212.github.io/posts/b9859a94/</id>
<published>2021-05-23T09:39:41.000Z</published>
<updated>2025-04-07T06:10:19.270Z</updated>
<summary type="html"><p>Python 的 import 机制是最令用户困惑的地方之一,在实践中非常容易出错,相信被 <code>ImportError</code> 和 <code>ModuleNotFoundError</code> 折磨过的同学都对此深有体会。本文完整地梳理 Python 的各种导入逻辑,力求在实践中避坑并提出一些最佳实践。</p></summary>
</entry>
<entry>
<title>LSM Tree:一种支持高效读写的存储引擎</title>
<link href="https://hzhu212.github.io/posts/2d7c5edb/"/>
<id>https://hzhu212.github.io/posts/2d7c5edb/</id>
<published>2021-02-03T13:08:14.000Z</published>
<updated>2025-04-07T06:10:19.269Z</updated>
<summary type="html"><p><strong>LSM tree (log-structured merge-tree)</strong> 是一种对频繁写操作非常友好的数据结构,同时兼顾了查询效率。LSM tree 是许多 key-value 型或日志型数据库所依赖的核心数据结构,例如 <a href="https://cloud.google.com/bigtable">BigTable</a>、<a href="https://hbase.apache.org/">HBase</a>、<a href="https://cassandra.apache.org/">Cassandra</a>、<a href="https://github.com/google/leveldb">LevelDB</a>、<a href="https://www.sqlite.org/">SQLite</a>、<a href="https://www.scylladb.com/">Scylla</a>、<a href="https://rocksdb.org/">RocksDB</a> 等。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="数据结构" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/"/>
<category term="数据库" scheme="https://hzhu212.github.io/tags/%E6%95%B0%E6%8D%AE%E5%BA%93/"/>
<category term="大数据" scheme="https://hzhu212.github.io/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
</entry>
<entry>
<title>shell命令的标准输入(stdin)</title>
<link href="https://hzhu212.github.io/posts/2c63bd16/"/>
<id>https://hzhu212.github.io/posts/2c63bd16/</id>
<published>2021-01-06T03:04:27.000Z</published>
<updated>2025-04-07T06:10:19.269Z</updated>
<summary type="html"><p>在 shell 命令中,有多种方式可以灵活地控制命令的标准输入(stdin),熟练掌握这些技巧有时会起到事半功倍的效果。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="Linux" scheme="https://hzhu212.github.io/tags/Linux/"/>
<category term="shell" scheme="https://hzhu212.github.io/tags/shell/"/>
</entry>
<entry>
<title>推荐一些Windows下的生产力工具</title>
<link href="https://hzhu212.github.io/posts/28fcbc62/"/>
<id>https://hzhu212.github.io/posts/28fcbc62/</id>
<published>2019-12-01T06:06:21.000Z</published>
<updated>2025-04-07T06:10:19.270Z</updated>
<summary type="html"><blockquote class="blockquote-center">
<p>工欲善其事,必先利其器。</p>
</blockquote>
<p>Windows 系统拥有 MacOS 和 Linux 无法比拟的软件生态,但可惜的是,大多数用户并没有真正发掘出 Windows 系统的生产力。本文推荐一些“小而美”的 Windows 软件,包括本地软件与浏览器插件,能够极大地提升工作效率。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="Windows" scheme="https://hzhu212.github.io/tags/Windows/"/>
<category term="工具" scheme="https://hzhu212.github.io/tags/%E5%B7%A5%E5%85%B7/"/>
</entry>
<entry>
<title>Python从零实现计算图和自动求导</title>
<link href="https://hzhu212.github.io/posts/7a426523/"/>
<id>https://hzhu212.github.io/posts/7a426523/</id>
<published>2019-08-08T06:54:05.000Z</published>
<updated>2025-04-07T06:10:19.269Z</updated>
<summary type="html"><p>计算图是现代深度学习框架如 Tensorflow、PyTorch 等的核心概念,其中涉及的所有计算几乎都依赖于计算图提供的自动求导功能,因此研究计算图对深入理解反向传播等深度学习的底层算法大有帮助。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="机器学习" scheme="https://hzhu212.github.io/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="深度学习" scheme="https://hzhu212.github.io/tags/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/"/>
</entry>
<entry>
<title>线性代数的本质</title>
<link href="https://hzhu212.github.io/posts/66517499/"/>
<id>https://hzhu212.github.io/posts/66517499/</id>
<published>2019-06-22T06:21:42.000Z</published>
<updated>2025-04-07T06:10:19.271Z</updated>
<summary type="html"><p>本文为 <a href="https://www.bilibili.com/video/av6731067/?p=1">3Blue1Brown-线性代数的本质</a> 系列视频的笔记。</p></summary>
<category term="笔记" scheme="https://hzhu212.github.io/categories/%E7%AC%94%E8%AE%B0/"/>
<category term="线性代数" scheme="https://hzhu212.github.io/tags/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/"/>
</entry>
<entry>
<title>概率统计笔记</title>
<link href="https://hzhu212.github.io/posts/b59aba05/"/>
<id>https://hzhu212.github.io/posts/b59aba05/</id>
<published>2019-06-15T11:00:49.000Z</published>
<updated>2025-04-07T06:10:19.270Z</updated>
<summary type="html"><p>本文为 <a href="https://book.douban.com/subject/1748397/">概率统计讲义</a> 一书的笔记。</p></summary>
<category term="笔记" scheme="https://hzhu212.github.io/categories/%E7%AC%94%E8%AE%B0/"/>
<category term="概率统计" scheme="https://hzhu212.github.io/tags/%E6%A6%82%E7%8E%87%E7%BB%9F%E8%AE%A1/"/>
</entry>
<entry>
<title>矩阵求导术</title>
<link href="https://hzhu212.github.io/posts/20d9a268/"/>
<id>https://hzhu212.github.io/posts/20d9a268/</id>
<published>2019-06-14T06:48:29.000Z</published>
<updated>2025-04-07T06:10:19.271Z</updated>
<summary type="html"><p>本文为知乎上的一篇文章 <a href="https://zhuanlan.zhihu.com/p/24709748">矩阵求导术</a> 的笔记。</p></summary>
<category term="笔记" scheme="https://hzhu212.github.io/categories/%E7%AC%94%E8%AE%B0/"/>
<category term="线性代数" scheme="https://hzhu212.github.io/tags/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/"/>
</entry>
<entry>
<title>远程工作流</title>
<link href="https://hzhu212.github.io/posts/8247595/"/>
<id>https://hzhu212.github.io/posts/8247595/</id>
<published>2019-06-10T05:56:53.000Z</published>
<updated>2025-04-07T06:10:19.271Z</updated>
<summary type="html"><p>远程工作的需求无非两个:</p>
<ol>
<li>远程执行命令。</li>
<li>在远程与本地之间进行文件的双向传输。</li>
</ol>
<p>所有的远程工作流都需要考虑如何提高这两个操作的效率。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="远程" scheme="https://hzhu212.github.io/tags/%E8%BF%9C%E7%A8%8B/"/>
<category term="ssh" scheme="https://hzhu212.github.io/tags/ssh/"/>
<category term="szrz" scheme="https://hzhu212.github.io/tags/szrz/"/>
</entry>
<entry>
<title>编码与乱码之追根溯源</title>
<link href="https://hzhu212.github.io/posts/b2d70b72/"/>
<id>https://hzhu212.github.io/posts/b2d70b72/</id>
<published>2018-10-27T02:26:40.000Z</published>
<updated>2025-04-07T06:10:19.271Z</updated>
<summary type="html"><p>乱码问题是不但是新手程序员之痛,也常常让许多资深 coder 束手无策。本文探讨编码的概念、乱码的原理,以及乱码问题的分析与解决。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="原理" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/%E5%8E%9F%E7%90%86/"/>
<category term="编码" scheme="https://hzhu212.github.io/tags/%E7%BC%96%E7%A0%81/"/>
<category term="乱码" scheme="https://hzhu212.github.io/tags/%E4%B9%B1%E7%A0%81/"/>
<category term="Sublime Text" scheme="https://hzhu212.github.io/tags/Sublime-Text/"/>
</entry>
<entry>
<title>Python与C++混合编程——Boost.python的基本使用</title>
<link href="https://hzhu212.github.io/posts/923b21ed/"/>
<id>https://hzhu212.github.io/posts/923b21ed/</id>
<published>2018-10-25T04:01:05.000Z</published>
<updated>2025-04-07T06:10:19.269Z</updated>
<summary type="html"><p>Boost.python 是 Python 与 C++ 混合编程的利器,本文探讨 Boost.python 的安装和基本使用。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="python" scheme="https://hzhu212.github.io/tags/python/"/>
<category term="C/C++" scheme="https://hzhu212.github.io/tags/C-C/"/>
<category term="Boost" scheme="https://hzhu212.github.io/tags/Boost/"/>
</entry>
<entry>
<title>Hexo + Github 搭建个人博客</title>
<link href="https://hzhu212.github.io/posts/4d5f7337/"/>
<id>https://hzhu212.github.io/posts/4d5f7337/</id>
<published>2017-05-28T15:10:43.000Z</published>
<updated>2025-04-07T06:10:19.268Z</updated>
<summary type="html"><p>按照以下步骤,你可以搭建一个与本站点同样简洁漂亮的个人博客,完全自由免费。</p></summary>
<category term="技术" scheme="https://hzhu212.github.io/categories/%E6%8A%80%E6%9C%AF/"/>
<category term="web" scheme="https://hzhu212.github.io/tags/web/"/>
<category term="Hexo" scheme="https://hzhu212.github.io/tags/Hexo/"/>
</entry>
</feed>