安徽省重點新聞門戶網(wǎng)站
安徽青年報官方網(wǎng)站
科大訊飛股份有限公司AI研究院副院長,認(rèn)知智能全國重點實驗室的青年領(lǐng)軍人才,首個國產(chǎn)自主可控、效果業(yè)界一流的訊飛星火大模型研發(fā)者之一......這一串沉甸甸的榮譽(yù)成果,來自年僅34歲的青年劉權(quán)。
“90后”劉權(quán)十余年的“科創(chuàng)路”走得堅定、艱難,卻熠熠閃光。
敢闖“無人之境”
“剛開始研究時,該領(lǐng)域參與的學(xué)校和研究者都比較少,知識庫沒有現(xiàn)成可獲取的,技術(shù)本身和系統(tǒng)評價都是難題?!眲?quán)說。
2012年,劉權(quán)加入了中國科大語音及語言信息處理國家工程研究中心,開展自然語言處理(Natural Language Processing,以下簡稱“NLP”)方向的研究。
當(dāng)時他所在的實驗室,同屆十幾名研究生同學(xué)都選擇了語音識別、語音合成等熱門和實驗室優(yōu)勢方向,他獨(dú)獨(dú)鐘情于自然語言處理。導(dǎo)師曾語重心長地勸他:“如果選擇這一方向,畢業(yè)可能有風(fēng)險,你考慮清楚了嗎?”
劉權(quán)沒有太多猶豫,因為興趣愛好堅定了自己的選擇?!霸谘幸粚?dǎo)師安排的一個項目中接觸了半年文本處理技術(shù)后,自己對從事自然語言技術(shù)研究的熱情快速上升,讓機(jī)器理解人類語言這件事情非常有趣。”劉權(quán)說。
2014年,科大訊飛開啟“超腦計劃”,希望全面打造認(rèn)知智能引擎,實現(xiàn)“從讓機(jī)器能聽會說、到能理解會思考”。同年,劉權(quán)成為了“超腦計劃”的一號研究員?!爱?dāng)時正值深度學(xué)習(xí)技術(shù)飛速發(fā)展的初期,感知智能技術(shù)取得了大幅突破,NLP領(lǐng)域也正在掀起一輪技術(shù)革新?!眲?quán)告訴記者,基于深度學(xué)習(xí)的自然語言處理技術(shù)不斷發(fā)展與突破,也逐步應(yīng)用在科大訊飛多項產(chǎn)品中,“舉個例子,汽車智能導(dǎo)航系統(tǒng)中,保證系統(tǒng)收到語音并識別成文本后,能夠理解文本語義與用戶意圖、完成對話系統(tǒng)響應(yīng)及回復(fù),就是我當(dāng)時的工作之一?!?/p>
2017至2022年,劉權(quán)主導(dǎo)研發(fā)了業(yè)界首個支持全雙工自由交互的中文語音對話系統(tǒng),并在智能汽車、智慧家庭等場景實現(xiàn)了大規(guī)模應(yīng)用落地。
五個月 培育“最聰明”的大模型
2022年11月底,ChatGPT橫空出世,就像是一顆巨石,在全球人工智能領(lǐng)域激蕩起陣陣漣漪。劉權(quán)是訊飛研究院內(nèi)第一位“觸摸”漣漪的人。
“在相關(guān)領(lǐng)域深耕了很久,看到這個成果,我非常興奮。它不僅可以智能回答人類的各類問題,在大量自然語言處理任務(wù)上的效果也非常驚艷。”回憶起當(dāng)時的場景,劉權(quán)的語氣仍有些激動。興奮之余,壓力也接踵而至。
新的挑戰(zhàn)出現(xiàn)了。時代的浪潮中,不進(jìn)則退,只有迎頭趕上。那年年底,依托認(rèn)知智能全國重點實驗室,在公司的支持和統(tǒng)一調(diào)度下,劉權(quán)牽頭帶領(lǐng)團(tuán)隊,開展訊飛星火大模型核心研發(fā)攻關(guān)工作。
“第一個模型訓(xùn)練完成后效果很不理想。”劉權(quán)記得,2023年春節(jié)后回來的那次測試,讓整個團(tuán)隊都有些緊張,“精心培育的幼苗,長勢卻不盡如人意。可時間緊、任務(wù)重,大家一刻都不敢松懈?!?/p>
經(jīng)過連續(xù)數(shù)周的高強(qiáng)度攻關(guān),持續(xù)不斷地更新迭代,三個多月的時間,他們不僅克服算力被限等諸多困難,還創(chuàng)新性地提出無監(jiān)督數(shù)據(jù)高效構(gòu)建及處理方法、有監(jiān)督指令自進(jìn)化方法、行業(yè)知識融合學(xué)習(xí)算法等技術(shù),促使大模型的測試分?jǐn)?shù)從30多分一路攀升到70分。
3月底,這項成果在企業(yè)內(nèi)部會議上第一次“公開亮相”?!澳翘欤麻L和各位領(lǐng)導(dǎo)都在現(xiàn)場。大家現(xiàn)場對研發(fā)的訊飛星火大模型雛形系統(tǒng)提了不少問題,我們做了現(xiàn)場測試和效果展示?!被貞浧饍赡昵暗哪翘?,劉權(quán)印象深刻,仿佛就在昨日,“模型對答如流,現(xiàn)場也響起了掌聲。那一刻,大家都很激動。”
這次成功亮相,也敲定了訊飛星火大模型的發(fā)布日期——2023年5月6日。當(dāng)年8月,《麻省理工科技評論》對中國主流大模型能力的評測報告中,訊飛星火大模型V2.0以81.5分(百分制計)的成績在本次評測中登頂,當(dāng)時被譽(yù)為中國“最聰明”的大模型。
讓國產(chǎn)大模型“持續(xù)向前”
今年11月6日,深度推理大模型訊飛星火X1.5發(fā)布,在全國產(chǎn)算力平臺上攻克MoE模型全鏈路訓(xùn)練效率,在模型參數(shù)小一倍的情況下對標(biāo)國外領(lǐng)先水平,其多語言能力超130種,為世界提供第二選擇,并推動教育、醫(yī)療等行業(yè)大模型能力升級。在自主可控的技術(shù)底座技術(shù)上,科大訊飛發(fā)布了融合AI+麥克風(fēng)陣列、AI+揚(yáng)聲器陣列等軟硬件一體的解決方案以及多模態(tài)交互能力,更圍繞“更懂你的AI”發(fā)布或升級了教育、醫(yī)療、汽車、辦公等多個領(lǐng)域的AI新產(chǎn)品。
“我們大模型最難得的不僅是‘聰明’,還有‘自主可控’?!眲?quán)告訴記者,訊飛星火大模型是迄今為止唯一在國產(chǎn)化算力上訓(xùn)練且持續(xù)進(jìn)步的大模型,走了一條最難但最“安全”的路——訊飛與華為聯(lián)合構(gòu)建國產(chǎn)算力平臺。一直以來,訊飛星火大模型在全國產(chǎn)化平臺上完成多次迭代升級,在研發(fā)上受限多、難度大,但在國產(chǎn)自主可控上具有無可比擬的優(yōu)勢。
“大模型研發(fā)不是三兩年就能分出勝負(fù)的,AI這條路還有很長的路要走?!眲?quán)說。在當(dāng)前激烈的中美AI科技競爭態(tài)勢下,國產(chǎn)化算力上訓(xùn)練大模型的過程極為艱苦,需要適配和優(yōu)化的工作極多、周期很長,為保持大模型競爭力需要付出額外的巨大努力,同時需要有昂揚(yáng)的奮進(jìn)精神和創(chuàng)新意識。
現(xiàn)在,訊飛研究院在大模型研究領(lǐng)域的青年研究團(tuán)隊,已經(jīng)從當(dāng)時的數(shù)十名拓展到數(shù)百名,過去幾年,他們完成了訊飛星火大模型的十余次重大迭代升級。目前,他們采取“雙線作戰(zhàn)”的方式:一方面在底座模型層持續(xù)創(chuàng)新,確保訊飛星火大模型在行業(yè)內(nèi)的領(lǐng)先地位;另一方面深入教育、醫(yī)療等垂直領(lǐng)域,讓AI為更多行業(yè)賦能?!安辉诤跻粫r快慢,重要的是持續(xù)向前。”劉權(quán)說。(見習(xí)記者 陳 璐)

劉權(quán)(右一)和研究團(tuán)隊成員
責(zé)任編輯:杜宇
