Googleはゼロ年代から、電話番号問い合わせサービスを無料化する代わりに

問い合わせの際の音声を録音し、その十数年のデータの上で機械学習をすることにより、

音声認識精度を向上させた。また、写真管理サービスを提供していたPicasaを買収し、

膨大な写真データを収集することで、人や物を識別し、分類する精度を向上してきた。

日本では想像がつかないようなサービスを世界に向けて無料で提供することにより

巨大なデータを集積する、という手法は、ベンチャーへの巨額投資の道筋がついている

アメリカならではだといえる。ヨーロッパはどうか。ヨーロッパの国々には

GoogleやAmazonのような企業はあまり見当たらない。

しかし、ヨーロッパは国際外交発生の地。ISO(国際標準化機構)など国際標準の基準作りや、

最近では「忘れられる権利」の検討など、制度設計に滅法強い。

では、中国ではどうか。政府の権限が極めて強い中国では、

アメリカとは全く別の手法でビッグデータを集めることに成功している。

中国では、国家公務員や教員に採用されるためには、標準的な中国語を話せることが必要条件であり、

そのための試験がある。年間100万人以上が受験するとも言われる

標準中国語のスピーキングテストの音声データを集めることを中国政府は決定した。