墨坛书屋 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

大语言模型是人工智能的一个落地应用方向,基础逻辑就是模拟类人神经网络,当训练数据达到一定规模时,会产生不可思议的效果,路阳就知道chatgpt的训练数据就是1750亿才开始爆发,有了质的变化。

这个过程还需要人类来做干预训练,让模型能给出更加接近的正确答案。

不过,对于中文数据来说,最大的问题还是数据质量。

数据质量越高,模型的训练结果越好,而华文数据质量,路阳只能苦笑着摇摇头。

巅峰时期的华国互联网,优质网站数量接近千万级,而到了2019年,这个数量降到了400万,曾经的四大论坛,天涯、猫扑、微博、贴吧,天涯半死不活,猫扑消失殆尽,至于微博,娱乐文化仍占主流,直到华芯的崛起,才让科技板块逐渐有了起色。

至于贴吧,男科不孕不育了解下!

唯一还在苦苦支撑的就只剩下知乎一支独苗,然而在大浪潮的侵袭下,90%以上的数据变成了打拳、键证、润学,水军、自媒体、营销号、饭圈总是喜欢为了点鸡毛蒜皮的事吵得天翻地覆,可谓是垃圾场里建游泳池,不似粪坑胜似粪坑。

当然,国外的互联网也不见得好到哪里去,但他们的体量庞大。

路阳最近还让人帮做了个统计,假设中文文本数据10亿条,高质量数据占比1%,英文文本数据20亿条,高质量数据占比5%,过滤后,可用于AI训练的中文数据只有1千万条,而英文有1亿条。

这个量级的差距,就算路阳占得先机,最后训练出来的结果也无法超越英文文本训练的人工智能。

实际上,英文互联网比华国要早几十年,真正的差距只会更大。

如果不过滤,那华国的数据肯定是足够的,但成长于充满广告、饭圈、矛盾争吵的数据环境中,路阳无法想象最终训练出来的模型会是什么样扭曲怪物。

中文数据还有另外一个大问题,那就是数据孤岛,国内的大厂从融资、估值到上市,都需要用户数据来讲故事,所以大量的数据被封闭在各大厂与平台中。

千度、阿里、企鹅都直接或间接的屏蔽了各自爬虫,即便有开源模型,数据也不会对外开放。

“提高华国互联网的优质数据,这方面已经提前在布局,而要解决数据孤岛问题,就得依靠国家的力量。”

路阳在心中思索着,电子科技大这边的行程,就是为了解决数据问题,华芯数据中心建成在即,需要大量高质量数据做填充,于是他计划与电子科技大这边合作,打造华国最大的知识分享社区。

硬件GpU部分,摩尔10月下旬即将发布首款自研专业级GpU,软件就得依靠这个平台。

应若涵的执行力是路阳最为佩服的,不到三天时间,来自华国前三的超导研究团队的专家进驻华芯二院,配合施小云设计零度控制系统。

“人都到了,按施教授的计划,这个系统需要两周才能完成。”

“半个月吗?那正好可以处理电子科技大的事?”

旋即路阳把平台的思路给应若涵做了个大概的介绍。

正如王德峰教授,汉语不只是一个交流工具,它融合了儒释道的思想,从仓颉流传而来的形象以及对炎黄血脉的认同,随着网络用语的扩散,很多承载着华国文化的词句语境可能都将不复存在。

把这些知识加入对模型的训练,不仅可以让文化得以传承,也可以让下一代更好的利用。

“我们的目标是建立起一个远超已有数据库规模,开放、互通、合理规范的超级华文语料库,并以此反哺华国互联网,输出优质知识。”

应若涵没想到路阳一下跨度拉得这么大,问道,“虽然我明白你说的,但这件事并不是最紧急优先的事,这个超级语料库按你的要求,短期内也不可能做好,而且这跟量子芯片似乎也关系不大。”

路阳知道她最近关心的是胡稚那边的进度,芯片小组已经在暗中做了大量准备,并提醒国家加大防疫系统的演练与物资储备,但路阳这边的行动,却没有一件跟这个相关。

归根结底,一方面是路阳确实对这方面没什么知识,另一方面就是大事件是全球性的,根本不可能防得住,除非你真正执行闭关锁国,但那又太不现实,损失太大。

路线想了下,继续说道,“我们的最终目的是造出量子芯片,完成量子计算机,对吧。”

应若涵点点头,这是集团董事会都知道的。

“量子计算机的应用,最适配的就是人工智能领域,而人工智能领域说是第四次工业革命一点都不为过,它可以让华国的科技整体再上一个台阶。”

这说法,应若涵心中是不太认可的,但路阳的特殊性也让她明白,这么做方向肯定是对的。

见应若涵仍不明白,路阳解释道,“人工智能是需要训练出来的,用大量数据通过人工干预训练,当数据量达到一定级别,你可以理解为,会出现具有部分意识的人工智能,它能帮助人类整体提速。”

这是路阳第一次把这件事告诉其他人,已经开始超越现有的人类认知。

既然自己的系统使用条件苛刻,存在风险,那就干脆造个系统出来帮助华国,这就可以让整个华国加速开挂。

哪怕应若涵对人工智能所知不多,但是凭借其超高的智商,还是快速想通了这一切,这样一来,路阳最近看似毫无关联的动作就可以串联起来了。

“路阳,你真的是来自2023年?可我怎么感觉你所说的事,像是未来几十年后。”

人工智能帮助人类提速,具有意识,这都是科幻电影里的场景,而往往科幻电影里的人工智能,大部分最后都变成反派boSS。

是啊,只是5年而已,这中间的差距就已经如此之大了,如果再发展二十年,未来世界又是什么样呢?

路阳并没直接回答应若涵的问题,也许对方也不需要他的回答。

“欧米人的科幻电影只能代表他们,华国真正意义上的科幻作品并不多,我现在也只能确认一点,只要你训练的数据足够多,质量足够好,一定会出现具有意识的人工智能,至于如何控制它,这就不是我能知道的了。”

“而且,这是一项颠覆世界的发现,而人工智能的能力,最终还是要落到算力上来,这是一切的根本!”

墨坛书屋推荐阅读:我在美漫当维度魔神末世脆皮空间大佬求抱大腿全球冰封,我囤货亿万无限开盲盒关于我在崩坏三的离谱生活一个叫苏鲁的丧尸决定去死银魂:星球守卫拥有荒古肾体的我,末世无敌了宇宙第二次巨变为晋升,我创造了可控核聚霸王花,小杠精,无敌的我亮晶晶天灾末世小人物囤货带美女跑路了异能觉醒后,我成了末日霸主末世生存,被我玩成了恋爱养成末世兵锋末日生存:我有哆啦A梦秘密道具魇日纪元末世不要跑变形金刚末世横行末世突降:我是全球最壕美食商贩星河战队:崛起末世国家:面前是末世,背后是我卖主角的小主神惊!闪婚领证,新婚夜她却孕吐了全球冰封:我靠零元购发家致富战警传奇全球冰冻:开局觉醒空间瞬移开局公布六代战机,鹰酱玉玉了!末日救赎:希望之光预知末世,洗劫最大军火库星球重启之新世界当无限降临北派盗墓笔记艾泽拉斯的泰坦之旅末世废土:这份菜单得加钱末日降临,我在废土中重获新生我团宠小师妹,嚣张点怎么了地球人实在太凶猛了网约车司机之AI死亡阴影全球冰封之前,我搜刮鹰酱溜回国林光宇轮回刺谈快穿之女配逆袭指南师兄,你别跑星际征途:明宇探险记我曝光前世惊炸全网人族禁地星纪帝国之枭宠狂妻末日后三个老婆没一个是人类我的科技图书馆末日危机:机器人反噬人类诸天:从射雕开始
墨坛书屋搜藏榜:快穿之反派女配不好惹魔方世界:末世困兽星际超越者末世废土:这份菜单得加钱诸天世界成神之路诸天从拯救岳夫人开始虫族领主:从继承顶级文明开始万剑之王尸命末世:想要变强?唯有囤积女神!谁说病娇不好啊,这病娇太棒了全球灾难:我有神级避难所佛系女主在末世的强者之路今天开始做神王穿越1862科技崛起从攻克癌症开始末世降临:我直接变身祖国人全民末日:只有我氪金十个亿当我重生的那几年星际,这个圈很大?快穿:重回巅峰宿主她专注种田红黄黑通灵师异闻录末世:无限军团系统开局末日开局获得地下基地快穿女神经:反派从不走剧情暴躁宿主她只想搞事业重生成为竹子大佬我又落地成盒了我在丧尸末日签到打卡快穿炮灰:反派终极攻略柯学:小小的愿望清单机甲狂涛星际小法师超神:我是天使的外挂我在末世能修仙带着全家苟末世快穿女主奋斗指南末世之阿猫阿狗阿兔我又穿进末世文了从湖伯到玉皇大帝冰川时代:举国进入愚公移山计划一个喷嚏打出的萌妹两界穿梭:我在末世逆天改命甜心出击:殿下哪里逃从地球开始机械飞升星际狂人从废土开始开黑交易之这个宿主真大佬仲启纪:人类编程计划
墨坛书屋最新小说:平行世界偷心人抱歉,我真没想到自己这么强穿成末世文里的恶毒女配穿书后,向导在艰难求生!恶女稳定发挥,男主们为她沉沦重生者:末世生存战梦境互联末日回溯:破晓重生之战末世:我靠卖丧尸直播暴富冰川纪元:我培养了绝世女皇宇宙无限食堂快穿女配被迫躺平了穿越星际种田日常恶女快穿:我在万千小世界杀疯了身软小雌性,撩得众兽夫失控沦陷万界时空门星际直播万人迷,帝国大佬争着宠我手握无限物资,砸出末世安全区公路求生:我无限物资带飞全家抱歉,我们队长她是六边形战士奶团三岁萌翻天,全家反派宠上天禁欲上将别咬,较软人鱼顶级暴徒莫名其妙成为虐文主角爹妈后末日重生之我做丧尸之王截胡机缘有奖励!亿万文明怕个毛末日小民女扮男装上军校,我被变态包围了绿茶宿主好妖娆,绝嗣男主轻诱哄星际兽世:凶猛兽夫心思有点野星际直播:荒星变成桃花源幻窜游戏柔弱恶雌被流放?众兽夫舍命护她兽世:反派人鱼崽崽拒绝从良系统穿成稀有雌性,兽夫们宠上天快穿恶女太魅,疯批男主缠上瘾空间通末世,我带飞全家很合理吧鸿运当头的我只想在星空之下活着末世:从第6次生物大灭绝开始让你修机甲,你整出了SSS级星际传奇?变异代码武道:吞噬世界之星耀宇宙流浪神秘星球机械觉醒,重启星际征程末日,人类生存末世重生之我有一个空间血源末世重生之末日时空主宰幻世逆途无限刷新,我有空间能保留物资末世,一条狗竟被五个大佬宠翻了