流水不爭先,爭的是滔滔不絕。
1
“和ChatGPT掰手腕”
5月6日,訊飛星火的燎原之勢初顯。
發布會現場,通過科大訊飛董事長劉慶峰和科大訊飛研究院院長劉聰的演示,可以看到科大訊飛此次推出的大模型訊飛星火,在文本生成、語言理解、數學能力上,展現出了不凡的思考能力和智慧。
從發布會展示的效果來看,訊飛星火似乎真如科大訊飛董事長所言,部分能力已經超過了ChatGPT。
文本生成方面,速度快,要點全,多模態。
從直播來看,訊飛聽見的實時雙語字幕在國內上市公司中確實無出其右,訊飛星火延續了科大訊飛的語音轉文字的優勢,人機交互時對話非常絲滑,文本生成能力極快,短短幾秒就迅速給出了相應文本。
從稿件質量上來看,字詞準確,語句通順,要求寫的歡迎詞要點俱全,讓人挑不出什么毛病;現場所編寫的故事也腦洞大開,能夠把一些抽象的角色,用關聯的思維邏輯串聯起來。
而除了文本生成,訊飛星火也可以根據要求進行人聲朗讀,還能迅速生成虛擬人的視頻。
從語音輸入,到文本生成,到語音朗讀,再到生成虛擬人的視頻,其內容生成能力與豐富的形態,或將顛覆不少行業。
語言理解方面,訊飛星火的智慧則更為凸顯。
而且除了真機實測實際系統現場互動,增加的現場實時互動,也給人更為直觀的沖擊。
舉個例子,當被問及,“俗話說,男子漢大丈夫寧死不屈;但俗話又說,男子漢大丈夫能屈能伸。這兩種說法應該怎么理解呢?”
訊飛星火并沒有被繞暈,給出的回答邏輯非常清晰,能夠很好的理解特定句子在不同場景下的含義,在后面的追問中,也能夠靈活調整自己的答案。
數學能力上,根據現場發言,訊飛星火已經超過國內外大模型,包括ChatGPT。
劉聰現場問出了一道復雜計算題,“花壇里有三種花,一共88朵,其中月季花的數量是菊花的4倍,牡丹花的數量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”訊飛星火在迅速給出答案的同時,也給出了具體的解題步驟。
而與數學一脈相承的代碼能力,知名前沿科技媒體《IT之家》,對訊飛星火展開了Python語言的算法代碼以及C++語言的測試。訊飛星火不僅能完整寫出代碼,并且能夠即時聯系上下文給出結果,還對算法思路進行了簡單補充介紹,可以說非常便捷且全面。
整體看下來,訊飛星火本身就有科大訊飛的文本優勢,在測試中面對邏輯上的設坑也能夠準確避開,其多變的展現形態,更是為多場景使用提供了豐富的想象空間。
2
大器晚成
從發布會現場來看,訊飛星火展示出了不俗的技術實力與競爭力。
但較于國內其他上市公司的大模型爭相加入首發熱潮,科大訊飛的反應似乎顯得有些“遲鈍”。
科大訊飛2月曾明確表示,訊飛星火是5月6日發布,不過6月9日發布也可以,說明對旗下的研究已經有十足把握了,發布會不過是早晚的問題。
其實6月9日發布,對科大訊飛是更有意義的,因為6月9日是科大訊飛的24周年慶。
認知大模型的發布對于科大訊飛來說,顯然也將成為一個意義非凡的日子;而且科大訊飛在業內屬于少有的比較有浪漫情懷的公司,其專門設立的1024開發者節,不僅是程序員的特殊紀念日,更暗含著1024這個計算機操作系統中特殊的進制單位。
目前,科大訊飛也公布了接下來的升級版本及發布時間。
6月9日,突破開放式問答(即實時問答)、多輪對話能力、數學能力再升級版本將被推出;8月15日,代碼能力再次升級,新升級的多模態交互能力也將正式開放給客戶;10月24日,直接趕超ChatGPT。
即使發布晚了,科大訊飛也并未顯示出過分擔憂的情緒,從一個企業的角度,他們也清楚地知道,認知大模型的核心是社會剛需。
大模型前景很好,但技術落地才能對社會產生實際價值,同時反哺公司,實現自我造血的良性循環。
戰略上來看,“平臺+賽道”是公司經過多年驗證的有效商業模式,這種雙輪驅動模式與現在星火認知大模型的“1+N”架構有著異曲同工之妙,其中,“1”是通用認知智能大模型,“N”是大模型在教育、辦公、醫療、汽車等多個行業領域的落地。
比如發布會上,“大模型+AI學習機”,展現出AI可以像老師一樣批改作業的能力,從字詞糾錯,到語病調整,再到作文評價,不僅更加精準高效,還展示出了像口語老師一樣的實景對話。
再比如,“大模型+智能座艙”,根據公開消息,科大訊飛在國內汽車智能語音應用市場保持占有率第一,而作為大熱的智能汽車行業,大模型賦能汽車實現更自由、更智能的語音對話已經走向現實。
最后一點,科大訊飛董事長劉慶峰在訪談中提到,“在安全性上我們還要更謹慎一點”,“一定要兼顧信息安全和倫理人文”。
流傳比較廣的一個新聞是,三星投訴ChatGPT泄露了其機密數據,據相關報道是說,三星有員工把敏感代碼上傳,讓ChatGPT幫忙改bug。但用ChatGPT輔助工作,傳上去就相當于直接公開,出于安全考慮,很多科技大廠還是選擇禁用ChatGPT。
如果有人惡意破壞,給ChatGPT投毒,甚至編輯暗網ChatGPT,刻意編輯一些引導性的語言模型,蓄意打破地緣政治平衡……后果可能更加難以想象。
不過,由于這場技術的顛覆性,掉隊的風險可能大于技術本身的風險,發展既不能操之過急,也不能因噎廢食,所以劉慶峰說的“謹慎一點”,從中長期目標來看,是正確的。
3
早有征兆
去年11月30日,ChatGPT在全球多個領域引起廣泛關注,12月份,科大訊飛正式啟動“1+N”認知大模型專項攻關,短短幾個月,訊飛星火應運出世。
幾個月當然不足以做出認知大模型,“大模型”這個概念只是后來才為人們所熟知,但實際上相關的技術嘗試和立項,并不在少數。
1999年創業之初,科大訊飛的目標就是讓機器像人一樣能聽會說。
2011年,科大訊飛承建了語音及語音信息處理國家工程工作室,而語音和語言的核心能力是開發認知大模型的基礎條件。
2014年,公司又推出訊飛超腦計劃,明確提出要讓機器人具備能理解會思考的能力,包括去年1月份宣布的超腦2030計劃,實際上也是在此領域深耕。
2017年,公司承建了認知智能全國重點實驗室,而去年12月啟動專項攻關之初,就是科大訊飛和中國科學技術大學共同承建的認知智能全國重點實驗室,牽頭設計了通用人工智能的7個重要方向的整套測試方法。
2017年,科大訊飛還讓機器在全球首次通過了國家執業醫師資格考試,并超過了96.3%參加考試的醫生,也就是在應用能力,甚至是專業的醫療方面,已經早早取得一定成果了。根據發布會,科大訊飛的醫療專業大模型,則預計在今年的1024期間正式發出。
騏驥千里,非一日之功。幾個月做出大模型只是表象,實際上在此之前的準備一步也少不了。
經過多年發展,科大訊飛在Transformer深度神經網絡算法方面,已經掌握了豐富的經驗。
開源證券研報指出,科大訊飛作為AI“國家隊”,技術積累深厚,在教育、醫療、政務等領域深耕多年,對下游需求理解深刻。
擁有超50TB行業語料數據以及每天超10億人次用戶互動的活躍應用,場景和數據優勢顯著。
多方比較之下,在核心技術方面,科大訊飛已經保持國際領先水平。
另外,據科大訊飛在今年4月通過投資者關系活動記錄表披露,其在總部自建了業界一流的數據中心,且已建成4座7中心深度學習計算平臺,為大模型訓練平臺提供硬件基礎。
目前科大訊飛已開源6個大類、超過40個通用領域的系列中文預訓練語言模型,相關模型庫月均調用量超1000萬,在Github平臺獲得星標數位列同類中文預訓練語言模型前列。
這條路可以說是用錢鋪出來的,連年增長的研發投入只是最基本的。
總的來說,無論是技術積累,還是算法和模型,亦或是研發投入,科大訊飛的技術實力是經過時間沉淀的。無論是從企業的角度,亦或是國家的角度,這都是一場不能輸的“戰爭”。
4
結語
2019年,科大訊飛被列入實體清單,其掌握的核心技術,讓美方忌憚。
科大訊飛擁有全球領先的人工智能核心技術,但慶幸的是,這次沒被卡住脖子。
劉慶峰在發布會現場強調,“一定要堅持做源頭技術創新”。被列入實體清單后,科大訊飛也迅速切換到了以國內供應鏈為主的非美供應鏈體系。在核心技術方面,我們這次保留住了技術的火種。
過去幾年里,科大訊飛牽頭承擔了國家自主可控人工智能平臺的諸多項目,還與華為、寒武紀、曙光等企業建立了深度合作。
“科大訊飛一直認為,人工智能的發展絕不是單個企業和單個科研機構的事情,而是需要大家合作共贏的。”劉慶峰說。
較為難得的是,不斷投入研發終于達到領先技術水平后,科大訊飛選擇了以開放的態度,點燃自己,傳遞星火。
發布會當天,“2023科大訊飛AI星火營生態計劃”正式啟動,計劃包括開放源頭技術能力、挖掘優秀AI人才、賦能優秀創業團隊等多方面內容。
雄關漫道真如鐵,面向未來,星火亦可燎原。