About

如何入场比特币&山寨币?

        今年1月我原本计划学习cs231n、看paper,但无奈最终没有成行,原因就在于炒币。1月初的币市疯狂程度令人难以想象:各类山寨币的走势如梦一般,每天以20-30%的走势向上攀升,我手中的许多币在短短半个月内翻了5-6倍。当然持续近一周的矿难(至昨天)将一切还原成12月初的样子,但我相信比特币和各类山寨币仍然充满前景。

写在工作一年半的转折点

        大约几周后我将离开北京,离开工作了快2年的地方去追寻另一种人生体验,回想起来有许多值得感慨的地方,又一时不知从何说起。

RNN系列之一:vanilla RNN模型

        两周之后我将在组内做一个有关RNN的分享会,此处记下近几日入门RNN时的部分总结。本文仅介绍RNN的结构、梯度计算、常见的训练问题和解决方案。对于LSTM/GRU和近期火热的SRU的总结会在下一篇系列文章里给出。

从LR 到 神经网络

        今天结束了Andrew Ng的Deep Learning系列课程Class1:Neural Networks and Deep Learning。习题中公式部分Ng仅给了结论,此处将给出完整推导。此外,在Week3练习中我对Logistic Regression和Neural Network之间的联系和区别比较模糊,本文也会将二者联系起来稍作总结。

搜索策略的 A/B 测试

        近期工作中调整了搜索得分策略,考虑影响面比较广,原工程里并没有A/B测试,因此完整实现了A/B测试部分代码,在此记录心得。

N-Grams模型初探

        从此文起,我将重心转移到对机器音乐的探索。Github项目jazzml能基于机器学习算法自动生成音乐,作者最初使用的生成模型即为N-Grams。本文是我关于Speech and Language Processing第4章N-Grams 的阅读笔记。

Amazon推荐系统20年

        ResysChina翻译了IEEE Internet Computing近期发表的文章Two Decades of Recommender Systems at Amazon.com,该文讲述Amazon推荐系统近20年的发展情况,作者是著名的Item CF算法发明者。下午我寻根溯源翻看了相关论文,特以此作总结。

如何编写一个拼写纠错器?

        2007年的某个星期,我的两个朋友(Dean和Bill)分别向我传达了他们对Google的拼写自动纠错能力的赞叹。例如输入"speling",Google会立即显示"spelling"的检索结果。我原以为这两位才智卓越的工程师、数学家,会对其工作原理有准确的推测,事实上他们没有。后来我意识到,他们怎么会对离自身专业领域如此远的东西认知清晰呢?

博客新开

        昨天早晨发现墙上有只小壁虎,用果盒盛起放窗外柜机上。晚上到家它仍在盒里,下楼买了迷你手电筒开灯放进去,期待今夜它与蚊子的战役。