2011/02/07

BBC 统计学的快乐

终于把《统计学的快乐》看完了。这个视频是BBC拍的记录片,主讲人是曾经在TED演讲过的Hans Rosling教授,下面是整个视频的一些keynotes
1.       通过统计学,可以分析数据,探寻这个世界中的规律,让我们的生活更美好。
2.       美国的旧金山将各种数据公布给大众,例如,他们公开了旧金山各个地区发生过的犯罪事件,让人们知道哪些地方安全,哪些地方比较危险。旧金山的CIO已经公布了163个公共数据库,他们的下一步目标把即时的数据推送给公众。
[BBC:统计学的快乐].BBC.The.Joy.of.Stats.WS.PDTV.XviD.avi_snapshot_08.53_[2011.02.07_21.12.44]
3.       第一份统计资料诞生在瑞典1749。当时的政府通过人口统计发现了本国的人口数量正在减少,于是瑞典政府采取措施以提高国民的健康水平。
4.       光有数据没有用,数据经过分析才有价值。一个最简单的方法是取平均值。
每年死于车祸的人数基本维持在一个相同的数字,像这样的数字可以总结出社会现象,也就是隐藏在数据中的模式。
5.       数据的分布可以使用图形来表示,优美的清晰的图形可以让大众都明白数据隐含的信息。
Florence Nightingale(护士职业创始人)在战争期间,她收集了两年的士兵伤亡数据,并发明了Polar area diagram (日本人译作鸡头图,中文貌似没有什么好的译名)来说明士兵伤亡的原因。
6.       数据的可视化(virtualization)已经成为了一门学问,还有Data Designer这种专门设计数据展示的职业。片中的designer展示了伊拉克战争的预算和实际支出,两个方块的大小对比确实让人惊讶。
7.       Rosling教授又做了一遍他在TED演讲中那个世界人均收入和寿命变化的演示。最后,他专门提了一下中国:上海的生活水平跟意大利相当,而贵州和巴基斯坦差不多。
[BBC:统计学的快乐].BBC.The.Joy.of.Stats.WS.PDTV.XviD.avi_snapshot_32.12_[2011.02.07_21.58.47]
8.       关于GOOGLE的机器翻译
Franz Och Google的机器翻译项目的老大)说:“创造这个系统的人不需要懂中文,但是要懂统计学,计算机科学和其他大规模计算的基础科学。”
Google的人下一步要把语音识别和机器翻译结合起来。
Wow,巴别塔要造起来了。
9.       天文学家使用计算机,互联网等新科技探索星云形成的规律,片中的天文学家在写sql
10.   因为计算机可以模拟各种各样的情况,未来的科学研究因为计算机科学的发展可能会从以数据为中心,由数据驱动转变为由假说驱动,然后由计算机去验证。
11.   Stanford大学的Sep Kamvar从微博等收集人们的情绪,并从不同的维度来分析比较,例如:男人比女人快乐吗?。他在片中说:年轻人更容易将快乐和刺激联系在一起,而老年人更容易将快乐和平静联系在一起。
12.   Kamvar教授最后说:因为人们越来越容易将自我的信息以数字化的形式放在互联网上,所以我们可以从互联网上大量的数据中理解人活着是为了什么。

最后一个观点让我想起了这篇文章:通过互联网认识自己
ZachZachary M. Seward)是《华尔街日报》的外联编辑,主要负责《华尔街日报》与 TwitterFoursquare 这类公司之间的关系。Zach 今天在《华尔街日报》Digits 博客分享了自己通过互联网对过去一年个人生活的总结,以下是主要内容的摘录。

幸好,这个只是纪录片。