May 22, 2008

经济半小时联合 Google 推出 “灾后重建手拉手,爱心援助点对点”活动



汶川大地震,不仅摧毁了家园,夺走了亲人,更多的是让我们原本融融亲情的安宁生活,一下子变的支离破碎。太多的家庭因为紧急转移而离散走失,500多万受灾群众当中,很多人现在最揪心的就是在寻找自己亲人的下落。尽管灾区现在还是余震不断,尽管交通和通讯还没有完全恢复,但一些受灾群众就已经走在了寻亲的路上。

经济半小时栏目将持续关注地震抗震救灾的进展,以一个志愿者的身份,出现在帮助受灾群众的队伍中。我们将用电波搭建起一个传送爱心的桥梁,用电视报道开辟一条直通灾区的爱心通道,让大家的爱心援助,通过我们的屏幕,点对点地传递下去,在灾后重建中,手拉手,用快捷、有效的方式,给受灾群众带去力量和希望。

经济半小时栏目推出“灾后重建手拉手、爱心援助点对点”的行动,不仅是电视媒体作为一个志愿者应尽的责任,更多的,是想通过这些信息的传递,在寻亲路上,实实在在的为灾区群众做一些事情。

天灾无情,人有情,我们希望公布的灾区的热线电话,和网络寻亲平台能够帮助您尽快寻找到灾区的亲人,也欢迎更多的人参与到我们“灾后重建手拉手、爱心援助点对点”的行动中来,有社会各界的努力,受灾群众一定能度过这个难关。

中国 Googler 的抗震日记(3)



5 月 18 日,谷歌员工为灾区捐款活动已经持续一周现在仍在继续,截止到今天员工和公司为地震捐款现金已达 1600 万,这个数字还在不断增加。我们也为各种救灾组织在谷歌网站免费刊登在线广告,并出资让合作伙伴网站也显示这些公益广告,总共广告价值约 300 万人民币,并已经得到接近 700 万人民币的募款。
    


    


5 月 19 日,公司里贴满了赈灾的海报。虽然我们身在北京,但都热切地想为地震灾区做些贡献,愿尽我们微薄之力,祈祷灾区同胞顺利渡过难关。
    


5 月 19 日,今天收到了来自国家测绘局的表扬信,这是长这么大第一次收到来自政府部门的表扬信,“让我们同心协力,为夺取抗震救灾工作的胜利,为灾区人民早日重建家园,做出更大的贡献。”看到这句话,感觉既沉重又温暖……
    


    


5 月 19 月下午 2 点 24 分,在 2 层的“商”举办了全体员工默哀仪式,很多 MM 流下了眼泪。同时,我们的首页改至黑白色,这是谷歌全球首次更改 logo 来纪念重大灾难。

5 月 20 日晚,谷歌地图和生活搜索团队再次更新了相关产品,感谢他们几个日夜不眠不休的努力!

哀悼与团结的曲线



汶川大地震——这场三十年来降临在华夏大地上最大的一次灾难,令整个中国陷入巨大的震惊与无比的悲痛之中。仅仅在几天之前,"地震"仿佛还是一个与你我无关的字眼,"汶川"也不过是厚厚的地图集中一个无人知晓的偏僻的所在。而在今天,一切都改变了。

当我们依照惯例整理和分析谷歌搜索引擎的流量数据时,一条从未见过的曲线出现在我们面前。当意识到发生了什么事情时,我们的眼睛湿润了。
    


2008 年 5 月 19 日 14 时 28 分,全国人民默哀三分钟,悼念在汶川大地震中遇难的同胞。

中国网民——他们中很多人如此习惯于通过谷歌来搜寻生活、工作和学习中所需
的各种信息。而在这一刻,他们——中国网民,散布在九百六十万平方公里神州大地上的中国网民,说着标准普通话的中国网民和带着四川、陕西、河南、浙江、广东、安徽、贵州、福建口音的中国网民——在这一刻,他们全部放下手中的键盘和鼠标,立起身来,低下他们的头颅,为他们的祖国,为他们的同胞。那一刻,庄严,肃穆。

所有人都这样做了;没有人监督,也不需要监督。这条谷歌搜索流量的曲线说明了一切。

在那一刻,谷歌的全体员工也放下手中的工作,齐聚会议室,为地震中遭遇不幸的同胞致哀,为我们多灾多难的民族祈祷。但我们的数据仪没有停止工作,它默默地记录下这条笔直下降的流量曲线。

2008 年的磨难把我们如此真切的凝聚在一起,2008 年的磨难让我们如此接近的与国家靠在一起。

如果机器也会思想,如果我们的数据仪也能读懂这条曲线背后的含义,它也会流泪吗?

或者,它更应该感动?因为它看到——

一个伟大的民族,在巨大的悲痛中低下她的头颅。而当她擦干眼泪,她的头颅扬得更高。

May 21, 2008

让机器帮你“通读”世界!



5 月 8 日下午,谷歌和金山联合发布了《谷歌金山词霸》,我们的很多用户也对谷歌的机器翻译有了初步的认识。其实,这并不是第一款应用了机器翻译技术的产品:在谷歌中文主页“语言工具”中早已包括了“翻译文字”、“翻译网页”等由谷歌机器翻译技术支持的功能。现在,我们就更全面地了解一下什么是“谷歌机器翻译技术”。

首先要给大家介绍一下传统翻译技术。以往人们都是把语言学家设置的语法规则和词典输入电脑,电脑根据语法规则进行翻译。而谷歌认为,人们未来将能够依靠机器逻辑而非语言学家把文件立即翻译成世界主要语言。

谷歌翻译的方案名为“统计机器翻译”(statistical machine translation),这与人们以往的努力不同。简单来说,谷歌的机器翻译将已经翻译过的相关语种文档输入电脑,让计算机学习、识别,并在未来的翻译中作为参考。按照谷歌规划的未来,人们完全可以在瞬间将自己的文档翻译成其他主要语种,并且只需要利用机器逻辑,无需语言专家干预。

下图可能会帮助你更好的理解谷歌“统计机器翻译”的基本原理。谷歌在网络上获取中英文文章后,通过对齐句子或句段,进行词语对齐及短语提取。当你需要翻译时,机器会通过统计得出该短语在一定语境下最常用的翻译,从而确保得到较好的翻译结果。
    


    

为了提高翻译的准确性和顺畅性,谷歌应用海量数据来训练模型。目前在翻译模型 P(E|C)中,约收录了两亿中英文词;在语言模型 P(C)中,约收录了一万亿中文词。在文本方面,已经有数百万份联合国和欧盟的双语文本被录入了计算机。通过对上述海量数据进行分析对比,谷歌的机器翻译能够方便快捷地提供精确的结果。以我们现在提供的网页翻译功能为例。当用户搜索出英文页面时,谷歌会自动提供页面翻译的功能。如输入“斯坦福大学”,搜索结果中出现的第一条为“Stanford University”,你只需点击旁边的“翻译此页 BETA”,谷歌的机器翻译便会直接为你呈现出中文翻译结果。
    


英文页面:
    


翻译后的中文页面:
    

从 2005 年到 2008 年,谷歌的机器翻译技术已连续3年获得美国国家标准局测试第一名。德国人 Franz Och 是谷歌翻译项目的负责人,他于 2002 年在德国最负盛名的理工科大学——亚琛工业大学(RWTH Aachen)获得计算机博士学位,并于 2004 年加入谷歌。Franz Och 博士的母语是德语,此外他还精通英语和意大利语。

当然,谷歌的机器翻译技术还不完美,这主要因为某些语言没有大量翻译的文件。对于此,Franz Och 指出:机器翻译比较麻烦的是缺乏译文对比的语言,比如非洲国家的一些语言,因为它们的使用人群并不大,“对照文本越多,翻译效果越好”。但是我们相信,通过不断努力,谷歌以领先技术贡献产业发展、服务中国用户的目标定会实现。