流氓遍地

很多年没在家过年了。今年好不容易有了一点点带薪假,又贴了一个礼拜自费的,定下来回家过年。貌似加拿大的华人不太热心赶这个热闹,所以多伦多往返北京上海的票价算是平价,不贵也不便宜。

然后开始张罗上海到武汉的行程。十几个小时的飞机以后我不那么想继续飞,想买火车票,结果证明这个想法是幼稚的。火车票恐怕在开始销售的前几分钟或者后几分钟就消失无踪了。没有证据也不能说这些票都被后门拿走了,但是既然春运是个可以预见的事情,为什么这么多年就整不出个让大家舒服点的办法呢?还好飞机票搞到了,据说经济舱都没了,也好,让我来看看商务舱有没有什么好吃好喝的

这个事情倒和流氓没什么关系。今天遇到的流氓是腾讯,就是做QQ的那个公司,不过和QQ无关,和SoSo有关。soso是腾讯推出的搜索引擎(这名字一听就是个没文化的人起的,soso, 英文意思好像是“一般一般”吧)。

今天早上忙完了票的事情,突然想起来看看这个网站的访问情况。一看不打紧,发现一群在124.115.0.*和124.115.4.*网段的ip不间歇的访问我,而且信息显示是Windows XP, IE 6.0。查地址,这个网段来自陕西中国电信。怀疑是恶意攻击,赶紧放狗搜了一下,原来被骚扰的还不止我一个:

引用内容 引用内容
近日,124.115.0段的IP大量出现在LOG记录中,连接次数非常频繁,造成服务器CPU使用率上升,消耗大量资源。根据IP地址查询得知,此IP是陕西省 西安市(电信机房) 电信,并非百度,谷歌等搜索的爬虫。访问IP记录为普通用户访问,初步判断不是搜索引擎,多数站长认为是采集器、群发软件等,纷纷将此IP禁止访问。

被站长封杀的这个IP段,其实是腾讯SOSO的爬虫,因为SOSO一直使用GOOGLE的搜索技术,加之IP是西安市,而不是北京,或者深圳,没人去联想到这个结果。


引用内容 引用内容
短时间发现服务器很难上去。而且mysql无法连接,由于我服务器没有几个站,个人使用。所以不对mysql连接数进行硬性限制。怎么会出现Can't connect to MySQL server on 'localhost' (10055) 呢?究其原因,我查看的冰盾防火墙的80端口使用。发现有10几个124.115.0.*及124.115.4.*字段的IP占用大量Tcp连接数。cpu占用达到100%,内存占用达到2.44G!可怕啊, 流量用掉10几G一天


赶紧把这两个ip段封掉,然后检查服务器那边,还好,流量方面问题没上面那个人严重。你说腾讯好歹也算是功成名就了,难道就那么舍不得开发经费?怎么还在用这种不入流的方法?

于是联想到百度,当年那个叫百度的流氓软件可是给我增加了不少工作量,现在别人可发达了,都在纳斯达克上市了,股价似乎还不低呢。是不是一旦成功,过去的一切就不会有人在意了呢?既然一日行窃,未必终身是贼,甚至能够做官,那是不是鼓励大家去做贼呢?作为一个三十有二的人,居然还会有这么蠢的问题,是不是太傻太天真呢?

然后想到微软,要是他家也用这个办法搞搜索大家会怎么想呢?其实微软也挺流氓,他倒是想强娶雅虎,可惜未遂,呵呵。

然后到了下午,偷空看新闻,又看到一个女流氓。

某男某女,婚姻期间有了一对双胞胎;然后离婚,孩子判给了妈,当爹的每月给抚养费;10年过后,突然当妈的觉得不爽了,提出来要求增加抚养费并减少当爹的看孩子的时间;当爹的也不爽了,提出做亲子鉴定;结果:那俩孩子并非这个爹的亲生子(显然这个当爹的心里是有数的);当爹的告上法庭要当妈的退还所有抚养费;官司输了,当爹的要继续给抚养费,理由:孩子不能没有爹;孩子找不到其他的爹;孩子他妈“想不起来”孩子他爹是谁。法官是女的。

养育之感情大于生育之感情,这个我是理解的,所以为孩子着想这个爹是有义务继续做爹的,可是这个妈适合继续做妈吗?这个八卦从各人的道德观或者人生观出发应该是有无数种不同看法见解的,然后由于背景资料的不足,想像的空间也是很大的。可惜我不怎么上bbs,不然这个也许是个好坑。

原文:http://www.thestar.com/news/gta/article/563571,已经有137条评论了。男同胞们要引以为戒啊,呵呵。


[本日志由 jieshu 于 2009-01-08 11:10 PM 编辑]
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: 乱弹
评论: 6 | 引用: 0 | 查看次数: 4324
回复回复jieshu[2009-01-09 03:51 PM | del]
火车这几天我已经被很多人恐吓过了。据说就算拿着软卧票春运期间仍然有可能挤不上车。
我还以为头等舱就是提前登机呢。头等舱休息室管不管饭?这次多伦多飞纽约待遇还行,来回分别喝了一罐啤酒,吃了个光有奶酪忘了放肉的三明治。毕竟就一个多小时,我很知足。
另外,我又长见识了,1,漂白;2,吃药。
回复回复jieshu[2009-01-09 03:45 PM | del]
做了一下统计,1月7号,58%的访问请求(7563次)来自于这个愚蠢的流氓的搜索引擎,流量占大约30%(要不是这天纽约照片的流量较大,这个比例会更高)。还好我这个站并非很著名,也还好服务器的额度很大不至于超额。不是不能被搜索,只是做什么都应该有规则嘛。
其流氓之处:
(1)每次几十个爬虫同时爬取网站,没有间隔,持续抓取。像网络蠕虫一样不考虑主机的承受能力,多线程爬取,无节制爬取,占用大量带宽,损耗大量流量!
(2)在爬取日志中Referer不为空,并且与其Request-URI一致,这样初看之下让人误以为是正常访问。
(3)不读取robots.txt。虽然在Soso网站的声明页中,说Sosospider会遵从Robots.txt的协议,但是实践证明,它们完全不理会 robots.txt中禁止访问的页面,照爬取不误
(4)在User-Agent字段中,soso爬虫不标明自己的身份,极不道德的伪装"Mozilla/4.0 (compatible; MSIE 6.0)"
回复回复ydd[2009-01-09 10:01 AM | del]
btw,只要说自己吃了药,这年头干啥都可以豁免。。。。。。
回复回复ydd[2009-01-09 09:56 AM | del]
不是台湾黑道漂白了就是正经商人,议员和县长了吗。没准韩国的也是,爱打架。

本地的头等舱我意外坐过一次,吃的大餐是非常不错,服务周到,就是人少,感觉与世隔绝,特别是随行的依然给分去了经济舱。现在看来那时候经济舱其实很好了,三小时的飞行里至少有很大的汉堡当午餐,现在五小时的飞行也只有饼干,饮料不收费都算额外恩惠。。。
回复回复feli[2009-01-09 09:24 AM | del]
火车睡一晚还是比较方便的。
另外,飞机定的是头等舱,不管飞机上区别有多大,据说在机场的待遇还是颇高的,可以考虑在头等舱休息室睡一晚上,哈哈:)
回复回复Victoria[2009-01-08 11:42 PM | del]
今天竟然让我抢到沙发了,太好了。你说的那个不入流的手法我还是没怎么看懂,但你们家这个网站,我在家里访问就很慢,据说是因为苏州电信分配给我家的那个IP段所用的路由如何如何了。所以我基本喜欢在公司里看。

另外,坐火车的想法是极其愚蠢的,一个晚上太漫长了,而且会睡不着睡不好。
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 开启 | [img]标签 关闭