巴别塔上的雇工


禁猪
1月 30, 2007, 3:10 下午
Filed under: 电影电视
据说虽然快到猪年,但是据说中央考虑到伊斯兰教哥们的情感问题,有指示不容许在电视的广告中出现出猪形象的内容,让人猜疑春节联欢晚会可能也不会有猪形象出现。十二年前似乎没有这回事,可能那时候传媒还没有这么大的影响力,拉登也没有磨刀霍霍,中央自然也不回想到这个。当然,我希望这个据说只是谣言,汉族人过个年还不让人爽啊!
 


历史
1月 29, 2007, 2:50 下午
Filed under: 电影电视
前几天说现在电视剧各说各道让人糊涂,不过,兼听则明,看到一些不同的东西,虽然让人糊涂,但是至少让人糊涂之后能够有想法去探索一下真相。
 
小时候看小人书见识国唐太宗的英名神武,那时候唐朝戏很少,关于唐太宗的就没看过,只有一个香港拍的纪录片《长城的故事》,和小人书一样,这么描述和突厥人的争斗:李世民上台不久,颉利带领突厥人打到长安郊区,派来使节在朝堂上口出狂言,李世民大怒,当下扣留了使节,带人去找颉利算帐,颉利不见使节回来,却见李世民亲自前来,心里先胆怯了,接着又看到几路唐军逼近,阵容整齐,觉得没有胜算,于是主动提出议和,李世民同意,而且表示愿意犒赏颉利的士兵以示天朝的宽容,双方在便桥杀白马结盟。这一段看的人荡气回肠,觉得李世民不战而屈人之兵,真是够生猛的。
 
今天晚上看《贞观长歌》,对这一段的描述却完全不一样,当时李世民刚上台,被他在玄武门杀掉的个个李建成的党羽四处谋反,突厥乘机来犯,当时长安的兵力三万,突厥有二十万,打不过,扣押了突厥使节之后也没有立刻带人去打,策划了好一阵子,终于开打,也是损兵折将,还好突厥不管冒进,才算挨过一关,估计再打是打不过了,干脆玩阴的,想贿赂分化本来就不团结的突厥部落,又怕贿赂老二不成,只好抹下面子,把钱全给了老大颉利,嘿嘿,反正钱也全给你了,你打长安来也没意义了,果然,颉利虽然还想打,但是手下人看着钱到手就都想回家了,颉利于是同意议和,还要送三千匹马给李世民作回扣作为侮辱,李世民觉得送礼已经很没面子了,还要收回扣简直就不用混了,打死也不要这三千匹马。真实奇耻大辱啊!
 
搜索“唐史”,出来的全是“唐史演义”,演义就是小说,不是史实,其他相关内容也是美化这段历史:

 “登基十几天后,突厥颉利可汗想要趁唐王朝更替之机入侵,李世民派尉迟敬德大败突厥。几天后,不死心的颉利又率军进逼,直抵渭水便桥。李世民得知消息怒不可遏,在唐军出发之前便先行带着房玄龄等六人骑马先行抵达渭河,隔河与颉利相会并对他加以斥责。不久唐军陆续抵达,颉利可汗既见李世民凛然无惧,又见唐军严整,不禁大惧请和。第二天,李世民再次亲抵便桥,与颉利可汗设盟,突厥退兵。返回的颉利可汗越想越是害怕,立刻又派人送来三千骏马、万头肥羊示好。李世民拒绝接受突厥的礼物,下令他必须立即归还历年掳掠的大唐子民。”

 
其实仔细想想,被人打到首都了,签订的条约,怎么可能还是平等的呢?
按照《贞观长歌》的说法,李世民做了这个行贿的决定,又不想后人骂他,找史官通融通融,能不能不写进历史,史官很NB的拒绝了,但是不知道后来怎么都把这段耻辱说成了胜利了呢,还是要找真正的唐史看看。估计是坊间不愿意正视残酷的历史,yy一把,把失败当成胜利,这不是什么好事,影响民族精神,当年老蒋放日本狗回去的时候,也开“天恩”,考虑到日本物资紧缺,让每只倭狗离开的时候从中国带走60公斤的物资,估计也是受了古代所谓施降天恩的影响,其实当时每只狗都应改剁了一只爪子再放回去。
 
 
 


糊涂
1月 27, 2007, 12:50 下午
Filed under: 电影电视
清宫戏估计是被看腻了,又开始拍别的朝代了。今天《贞观长歌》上场,呼应前一整字的《贞观之治》,据说还有一部吴越电视剧呼应《卧薪尝胆》,按照我们搞软件的说法,这就是reinvent wheel,一方面资源浪费,一方面容易产生bug。这样短时间内对同一主题故事重复讲述,而且讲的又不一样,让人很糊涂。



米高杰逊
1月 26, 2007, 2:08 上午
Filed under: 八卦杂谈
前几天看了胡戈的《北韩007大战黑衣人》,觉得最逗的是小胖子模仿迈克.杰克逊(港称“米高杰逊”)的Beat It那一段,然后补课看了以前的《鸟龙山剿匪记》,发现也是这个小胖子一段模仿迈克的Smooth Criminal。拍《鸟》的时候还是很粗糙,小胖子跳舞的时候西装上衣和裤子材料颜色都不一样,我都怀疑是不是服装要演员自带,傻大木的手下的演员可能都是找女朋友借了条纱巾包在头上就算是恐怖分子了;) 到《007》的时候,小胖子和他的伴舞都有像样的行头了,而且还有吊钢丝的打斗场面,不错:p
 
在大学的时候,同学们也特别喜欢看米高杰逊跳舞,虽然米高动作就那几个,而且据说还有不良嗜好,但一看他跳舞,大家就和傻大木一样,全身也想扭动一下,只是都扭得稍微比傻大木好一点而已:)
 
 
 


承认了,咋的
1月 24, 2007, 1:47 上午
Filed under: 八卦杂谈
昨晚忙到晚,没看新闻,今天早上才得知,外交部发言人用一言带过的方式,含蓄地,委婉地,承认了外空导弹试验,同时表示……
 
 


间谍
1月 23, 2007, 1:45 上午
Filed under: 电影电视
晚上看CCTV-8的《卧薪尝胆》,姑且认为是按照史实拍的,越国对间谍的使用真是下功夫,吴王夫差的朝堂上被窝里都是越国的间谍,怎能不败。曾在吴国供职的孙武的《孙子兵法》里专门有一篇《用间》,陈述了间谍活动的重要性,只可惜没有说如何“反间谍”:)

这个片的编导似乎想说明,夫差好歹算是一个有情有义的大丈夫,这比称王称霸重要,现在电视的访谈节目上衣冠楚楚的企业家都喜欢说“要做事,先做人”,貌似主旋律都一样,不过且慢,人家叫你学会做人,没说让你学会做好人啊:) 做事都要有个基本道德,企业的基本道德就是赚钱,国家的基本道德就是强大,所以就有必要刺探对手的情报,攫取别人的信息,企业尚有法律约束,国家之间无所不用其极,输了就是输了,有情有义的loser也是loser。



滑雪
1月 22, 2007, 1:54 上午
Filed under: 山河好大

上周六去郊区滑雪,滑雪场在平谷区,虽然还是北京地界,但还要借道河北才到。

北京今年就没怎么下雪,雪场的雪都是人造的,和真雪没什么差异。据说“暖冬”气候重创了欧洲阿尔卑斯山地区的旅游业,虽然他们也有造雪机,但是欧洲人讲究,不是真雪还不乐意去,所以滑雪场门可罗雀,但是在中国就是另外一番景象。到雪场就有一个感受——中国人真是多啊!虽然拥挤得很显得不方便,但是好歹有这么多中国人出来休闲,说明至少文明进步了一些。

这是我第一次滑雪,这运动上手还是比较快,平地滑没什么问题,兜了几圈就想上初级道玩把带坡度的。上初级道排队等托纤就要半天,然后抓着托纤滑好几分钟才到坡顶。上面不少人跃跃欲试又扭扭捏捏怕摔着,叨叨叨在那里光说不练,我瞅个空隙,直接出发了。看别人滑感觉很容易,但是自己一上道,就被速度吓了一跳,一出发就收不住,越来越快,要停下来只好侧过来翻倒,就这样摔了两次,也滑了一半的路程,差不多适应了速度,然后一气滑到坡底,虽然速度快,但是咬牙坚持住不要怕撞着人,也就没问题了:) 第二次又摔了一次,如果有第三次,按照等差数列应该就不会摔了,不过排队等托纤实在太无聊,还是在平地上玩了。



摧毁卫星
1月 19, 2007, 8:04 上午
Filed under: 八卦杂谈
我自制的Vista Sidebar上的RSS Reader起了一点作用,让我及时知道了中国成功进行击毁卫星实验
中国媒体似乎还没有报导这件事,外国媒体已经迫不及待宣称这是一个offensive capability.按照他们的思维,他们能打我们,那是世界安全保障,我们能打他们,就是威胁世界和平。口水仗还是要打,但是最终还是实力说话。


断缆
1月 19, 2007, 1:51 上午
Filed under: 技术体会

海底光缆被台湾地震绷断之后,工作受的影响很小,公司有专线连到国外出口的proxy,访问国外网站没问题,但是通过这个proxy访问国内网站稍慢,IT提供了北京出口的proxy,通过这个代理访问国内网站就好了。

前几天需要Crawl很多中文、日文、韩文的网页进行统计分析,用perl写的脚本,以几个CJK门户网站为种子开始扒。一开始使用外国出口的proxy,拿日韩的网页嗖嗖的,但是啃国内的网页相对就很慢,要是换成国内proxy那下日韩网页又不行了。一个简单的解决办法,对进入waiting list的URI,不光记录深度(depth)和序列号(Sequence ID),还记录referer encoding,从waiting list里面拿出一个待crawl的URI记录的时候,根据referer encoding推测出referer的语言,GB2312对应中文简体,EUC-JP和SHIFT-JIS对应日语,EUC-KR对应韩语,BIG-5对应中国台湾繁体,但是似乎台湾网站用什么代理访问都慢,而且语言使用习惯和简体中文没有什么区别,所以不作特殊考虑。如果referer是某种语言,那么它所包含的link也很有可能是这种语言,而且如果是中文网页,很有可能它是在中国大陆,就是用北京出口的代理,其余的用国外代理。一个特殊情况时,如果referer是UTF-8 encoding,理论也可以推导出语言,但是我Crawl这些网页目的就是为了实现这种推导方法,鸡和蛋的关系:) 似乎中国特色的网站还是普遍使用GB2312及其兼容编码,所以referer是UTF-8的情况,还是用国外代理。实验了一晚上,效果还真不错。



A Cool Perl Trick
1月 18, 2007, 7:52 上午
Filed under: 技术体会

用Perl这么一整子,今天要夸一夸这头骆驼。要获得一个hash中所有value,不要重复,比如有

	%hash = qw (gb2312 CN big5 TW euc-jp JP euc-kr KR shift-jis JP);

想要获得一个list包含CN,JP,KR,可以用List Module,不过ActivePerl 5.8.6缺省没有,还是自己动手,丰衣足食,两行就搞定了

	
	my %count;
	@list = grep { ! $count{$_}++ } values %hash;

用values获得所有value的list,但是这是包含重复值的,然后用grep函数筛选,第二个参数是一个block,$_是后面value %hash中每个元素的alias,用一个hash表示是否曾经有重复value。