“这个思路很不错啊,相当于做一个大全出来,不过面对一些非问答性质的内容,该怎么进行深度处理,这个方面你有考虑过吗?”张龙提出了自己的问题。
周岩知道张龙这个问题,也是后来open团队重点解决的一个难点。
即把一段内容,自动拆分成若干问题和解答,这个一方面涉及到了自然语言处理和机器学习,一方面还涉及到了一系列奖励算法。
之后几年出现的大模型问答,其实本质上是用户给出问题,然后机械搜索出解答,但是gpt的出现,则把给出问题这个步骤进一步省略,人类只要提出要求,gpt就可以自动拆分成问题并完成一系列地解答,相当于更加智能化,这也是为什么gpt会被很多人吹捧的原因。
要做到这一步,一方面需要人为训练,一方面也要优化奖励算法。
这需要一个时间去不断迭代。
“我的想法是等真正做出一个雏形以后,搜罗国内这方面相关的专家,专门研究出一套算法来。”周岩笑着说道。
张龙点点头:“是个好主意,我就怕你一个人花太多时间在上面,程序这种东西,有时候真的需要团队合作分块来完成,这种token拆分的方式目前国内说实话并没有谁特别有建树,不过你可以往自然语言处理方向去找。”
“要不我在圈内给你发个公告出来,找一些机器学习、深度学习算法,熟悉最优化模型和自然语言处理模型的人才过来,这个方面国内虽然研究的人还不是很多,但也有一些。”张龙说。
周岩点点头:“可以,不过我现在可给不起太多的薪水,而且这种东西其实是研究性质,太多的人知道也不太好,我更偏向于成立一个专门研发模型的小组,并不需要太多人,一些可以外包的直接外包出去,核心技术小组内的人知道。”
张龙笑了笑:“产品都还没弄出来,就想以后的事情啊,不过周岩你的这个方向确实很有搞头,甚至如果真的做出一个能理解人类的语言并给出优质解答的智能模型,那么很多行业其实都可以回炉重造一遍,最直接的就是单机游戏,如果单机游戏里的npc能真正理解人类对话,并完成类似人类的回复,那么绝对会让游戏的可玩性大大提升。”
“没错,这个问答模型只是第一步,如果能以此做出真正的大语言模型,那绝对是划时代的。”周岩笑着说道。
后世gpt真正爆火的时代被称为元年,但其实gpt早就出现了好几年,更新迭代了好几次,之所以过了很久才爆火,跟‘理解’这个词不无关联。
gpt在后来真正做到了‘理解’,也成功受到了一众人士的追捧。
要做到这个‘理解’,那可真是需要各个领域同步发力。
而那个时候的国内,还在研究另一个方向的模型,因此也有些落后于国外。
这就跟里的工质飞船和无工质飞船一样,研究了工质飞船,就没办法研究无工质,同时研究代价太大,这也是为什么章北海会为了让整个人类航天进程朝无工质发展,而选择干掉一众守旧的老航天。
如今国内的专家,其实都觉得这种问答模型没有什么意义,毕竟你人为都可以填充一些问题和答桉进去,外国的这种技术可不就是小儿科过家家一样的玩意儿吗。
但未来就是这种过家家的玩意儿,着实打了一众专家的脸。
甚至国内也开始过家家,生生地把发展方向转变得跟国外一样。
多少有点...
周岩也知道现在做这个方向,等成果出来后又少不了一些专家评头论足,不过产品从来不是少数人说不好就是不好的,也不是少数人说好就是好的。
就比如贾某浅的厕所诗,被文坛一些人追捧,也改变不了它的气味。
只会让一些恶臭的人,更加恶臭。
“扯远了。”周岩笑着说:“再说说其他公司的情况吧。”
“