不买?
我直接倒进臭水沟里。
拉里·佩奇道:“Knol,知道吗?一款旨在跟维基百科竞争的产品,07年研发、08年上线,可是做了几年,成绩不是太好。谷歌现在的核心战略是做社交,一些分心又表现不好的产🏡🛨🞶品,都会陆续关掉。”🜀⚨📺
“维基百科的竞品?”周不器还真是挺感兴趣,“具体说🅔🆓说。”
在国内,紫🖅微星有微点百科,提供类🍡🉥似维基百科类的服务。
海外市场并没有这样的产品。
维基百科实在是太强大了。
好在两年前周不器曾批准了一笔交易🍡🉥,紫微星国际收购了一家内容产品平台Quora,也就🕍🈘是传说中的“美版知🃡乎”。
做内容,始终是紫微星在国内外市🄑☢场都在努力发展♺🍛🈶的一个方向。
未来的互联网市场,归根结底是内容为王。
谁有内容谁就有制霸权。
包括未来的人工智能大语言模型也是。
就比如🃑🗂ChatGPT😌⛥、文心一言这类的AI产品,想要有令人惊人的智能表现,就一定得经过无数数据内容的训练🅫🈘才行。
可🉑🆩💍是,数据是不能🖈🐪乱用的,只有公🄑☢开数据或者开源数据,才能免费地供全球的开发者使用。
全球有一个超大型的免费的数据库。
什么语言都有,90🁟🖕%😌⛥以上都是英文的语料库,中文语料数据也就是2%左右。
全球几乎所有的AI模型,想要训练都要依靠着这些公开的数据内容才行。因为都是英文数据,所以这些AI模型,一定都😁⚀🎐是以英文为核心。
所以当百🂳💻🗁度的文心一言推出之后,就会出现很多令人🞛🔳🄭难以理解的事……其实原因很简单,文心一言使用的是英文数据,中文语料的数据实在是太少了。
别看国内🂳💻🗁人多,但网络上真正有价值的内容实在不多,稍微出格一点,这些🃃🕈有价值的语料就要按法律法规给🍳删除了。
就剩下了一堆没法训练AI的垃圾内容。