半路遇到的时候

你认识我的时候,我已是待嫁的年龄,你没有见过我和男生成群结队去翻墙爬树的样子;

你认识我的时候,我已经蓄了很久的长发,你没有见过我剪成一层一层的短发,在食堂让大家目瞪口呆的样子;

你认识我的时候,我已经可以照顾自己,心情不好就做家务,手洗各种衣服,你不知道从前的我不会洗袜子,从没拖过地。

你认识我的时候,我知道替别人着想、习惯倾听,从不打断别人的说话,你没有经历过我武断专横、不听任何人解释、我 ...

DDoS deflate - Linux下防御/减轻DDOS攻击

前言

互联网如同现实社会一样充满钩心斗角,网站被DDOS也成为站长最头疼的事。在没有硬防的情况下,寻找软件代替是最直接的方法,比如用iptables,但是iptables不能在自动屏蔽,只能手动屏蔽。今天要说的就是一款能够自动屏蔽DDOS攻击者IP的软件:DDoS deflate

DDoS deflate介绍

DDoS deflate是一款免费的用来防御和减轻DDoS攻击的脚本。它通过netstat监 ...

Ubuntu 11.04 已开始全球分发 | 已经发布

Ubuntu 11.04 将在今日晚些时候正式发布,目前安装镜像已出现在分发服务器,随后各地镜像同步完成后将提供下载。如没有特殊需要的话,建议暂时不要下载或使用客户端的离线下载,以免影响全球镜像同步。

8468300a61ea1e3b7607f46f7643b57a *ubuntu-11.04-alternate-amd64.iso

e6a29ce3dccb0ab12332036dcff7d9e4 * ...

余弦定理和新闻的分类

余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。具体说,新闻的分类很大程度上依靠余弦定理。

Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其实读不懂新闻,它只能快速计算。这就要求我们设计一个算法来算出任意两篇新闻的相似性。为了做到这一点,我们需要想办法用一组数字来描述一篇新闻。

我们来看看怎样找一组数字,或者说一个向量来描述一篇新闻 ...

如何确定网页和查询的相关性

[我们已经谈过了如何自动下载网页如何建立索引如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。]

我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索 ...

矩阵运算和文本处理中的分类问题

我在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法,还是看不到可以应用的地方。当时选这些课,完全是为了混学分的学位。我想,很多同学都多多少少有过类似的经历。直到后来长期做自然语言处理的研究,我才发现数学家们提出那些矩阵的概念和算法,是有实际应用的意义的。

在自然语言处理中 ...