1、ChatGPT將推出語音和圖像輸入功能
2、OpenAI發(fā)布視覺模型GPT-4V及其系統(tǒng)卡論文
3、Spotify合作OpenAI推出AI語音翻譯功能
4、Getty合作英偉達推出生成式AI工具
5、微軟招聘核技術(shù)經(jīng)理 或用核電供能AI數(shù)據(jù)中心
6、百度發(fā)布首個量子領(lǐng)域大模型及兩大AI原生應(yīng)用
7、合合信息等發(fā)布業(yè)內(nèi)首個古彝文基礎(chǔ)編碼數(shù)據(jù)庫
8、抖音上線地方方言AI自動翻譯功能
9、中美多家機構(gòu)聯(lián)合發(fā)布大模型可解釋性技術(shù)綜述
10、潞晨與瀾舟將合作打造企業(yè)級LLM解決方案
11、中國電信在深圳成立含AI軟件業(yè)務(wù)數(shù)智公司
12、梅安森計劃推出第一代礦山安全模型
13、耐能宣布完成9700萬美元B輪融資
14、AI醫(yī)療公司惠每科技宣布完成超3億元D輪融資
15、諾和諾德合作Valo 基于AI尋求CMD新療法
16、諾基亞將在迪拜設(shè)實驗室推動AI技術(shù)應(yīng)用
17、木頭姐:在AI方面有比英偉達更好的賭注
18、英國政府:AI對多邊體系構(gòu)成了“嚴峻考驗”
1、ChatGPT將推出語音和圖像輸入功能
當?shù)貢r間25日,OpenAI于官網(wǎng)宣布將在ChatGPT中推出新的語音和圖像功能,允許用戶進行語音對話、上傳圖像。該系列功能將在兩周內(nèi)于Plus和企業(yè)版推出,其中,語音功能將在iOS和安卓平臺提供,圖像功能將在所有平臺提供。據(jù)介紹,新的語音功能由新的文本轉(zhuǎn)語音模型提供支持,能夠僅從文本和幾秒的樣本語音中生成類似人類的音頻,OpenAI與專業(yè)配音演員合作創(chuàng)作了每一個聲音,并使用開源語音識別系統(tǒng)Whisper將用戶的口語轉(zhuǎn)錄為文本。圖像理解由多模態(tài)GPT-3.5和GPT-4提供支持,這些模型將其語言推理技能應(yīng)用于各種圖像,例如照片、屏幕截圖以及包含文本和圖像的文檔。

2、OpenAI發(fā)布視覺模型GPT-4V及其系統(tǒng)卡論文
當?shù)貢r間25日,OpenAI于官網(wǎng)發(fā)布多模態(tài)視覺模型GPT-4V(Vision)系統(tǒng)卡論文。據(jù)介紹,GPT-4V使用戶能指示GPT-4分析用戶提供的圖像輸入,其訓(xùn)練于2022年完成,并在2023年3月開始提供早期訪問系統(tǒng)。該系統(tǒng)卡概述了OpenAI如何為GPT-4部署視覺功能,并分析了GPT-4V的安全屬性。
論文地址:
https://cdn.openai.com/papers/GPTV_System_Card.pdf

3、Spotify合作OpenAI推出AI語音翻譯功能
據(jù)外媒The Verge報道,流媒體平臺Spotify近日合作OpenAI,基于OpenAI的語音轉(zhuǎn)錄工具Whisper推出AI語音翻譯功能,利用該工具將其他播客的英語劇集翻譯成另一種語言,并以播客自己的聲音合成版本再現(xiàn)。該功能目前已推出西班牙語翻譯,并計劃在未來幾周內(nèi)推出法語和德語翻譯。
4、Getty合作英偉達推出生成式AI工具
近日,Getty Images合作英偉達推出一款生成式AI工具,基于英偉達的Edify模型,用戶可根據(jù)Getty Images的授權(quán)照片庫創(chuàng)建圖像。該工具將與標準的Getty Images訂閱分開定價,并且定價基于即時數(shù)量,但Getty未具體說明價格。Getty承諾,任何使用該工具并發(fā)布其商業(yè)圖像的人都將受到法律保護。

5、微軟招聘核技術(shù)經(jīng)理 或用核電供能AI數(shù)據(jù)中心
據(jù)IT之家報道,根據(jù)微軟官網(wǎng)的一份招聘啟事,微軟正在考慮使用核電來運行其大型數(shù)據(jù)中心。該公司正在尋找一位“核技術(shù)首席項目經(jīng)理”,此職位的任務(wù)是領(lǐng)導(dǎo)SMR(小型模塊化反應(yīng)堆)和微反應(yīng)器集成的技術(shù)評估,為微軟云和AI所在的數(shù)據(jù)中心提供動力。

6、百度發(fā)布首個量子領(lǐng)域大模型及兩大AI原生應(yīng)用
據(jù)百度微信公眾號發(fā)文,9月23-24日,2023量子產(chǎn)業(yè)大會在安徽合肥召開。會上,百度量子計算研究所所長段潤堯發(fā)布首個量子領(lǐng)域大模型,及百度量子助手和量子寫作助手兩大AI原生應(yīng)用。他還發(fā)布了量子領(lǐng)域大模型白皮書,展望量子領(lǐng)域大模型的未來發(fā)展趨勢和技術(shù)潛力。據(jù)段潤堯介紹,該量子領(lǐng)域大模型是在文心一言基礎(chǔ)上,使用量子領(lǐng)域高質(zhì)量數(shù)據(jù)進行更有針對性的訓(xùn)練和優(yōu)化而構(gòu)建的量子領(lǐng)域大模型,能更好地理解量子知識,專業(yè)執(zhí)行量子任務(wù)。
7、合合信息等發(fā)布業(yè)內(nèi)首個古彝文基礎(chǔ)編碼數(shù)據(jù)庫
近期,合合信息聯(lián)合上海大學(xué)、華南理工大學(xué)發(fā)布業(yè)內(nèi)首個古彝文基礎(chǔ)編碼數(shù)據(jù)庫,該項目由合合信息與上海大學(xué)社會學(xué)院、華南理工大學(xué)文檔圖像分析識別與理解實驗室共同推進,針對現(xiàn)有的《西南彝志》、云貴一帶字符,通過智能圖像處理、智能文字識別等AI技術(shù)開展統(tǒng)一編碼,并于近期發(fā)布了業(yè)內(nèi)首個古彝文基礎(chǔ)編碼數(shù)據(jù)庫(簡稱“數(shù)據(jù)庫”)。

在對7萬6千字符的樣本進行訓(xùn)練后,團隊成功建立了包含上千個古彝文基礎(chǔ)編碼的數(shù)據(jù)庫。在收集語料收集的過程中,研究人員使用了合合信息旗下掃描全能王“智能高清濾鏡”功能,高效解決古彝文識別的版式檢測、圖像處理和文字識別等難題。對于污漬、殘破的彝文古籍,收集者只需通過“智能高清濾鏡”輕輕一掃,即可得到一張清晰、平整的圖片。
通過API數(shù)據(jù)接口等形式,該數(shù)據(jù)庫有望幫助高校研究人員、文化工作者、興趣愛好者等人群快速找到古彝文在字典中的讀音、漢語釋義、用法,如同“大字典”一般,幫助人們降低古彝文書籍、文獻閱讀的門檻。
8、抖音上線地方方言AI自動翻譯功能
據(jù)央廣網(wǎng)報道,抖音于近期上線了方言自動翻譯功能,創(chuàng)作者可以“一鍵”將粵語、閩語、吳語、西南官話、中原官話等方言視頻轉(zhuǎn)化出普通話字幕,方便公眾觀看。據(jù)介紹,抖音火山引擎技術(shù)團隊采用了自研的自監(jiān)督預(yù)訓(xùn)練模型和多語言翻譯模型,實現(xiàn)了極少量標注數(shù)據(jù)條件下識別方言的能力,且訓(xùn)練效率提升一倍,有效提升了多語言翻譯的性能,同時大幅度降低了模型訓(xùn)練的資源消耗。
9、中美多家機構(gòu)聯(lián)合發(fā)布大模型可解釋性技術(shù)綜述
據(jù)機器之心報道,近期,中美多家機構(gòu)(新澤西理工學(xué)院、約翰斯·霍普金斯大學(xué)、維克森林大學(xué)、佐治亞大學(xué)、上海交大、百度等)聯(lián)合發(fā)布了大模型可解釋性技術(shù)的綜述,分別對傳統(tǒng)的Fine-tuning模型和基于Prompting的超大模型的可解釋性技術(shù)進行了全面的梳理,并探討了模型解釋的評估標準和未來的研究挑戰(zhàn)。
論文鏈接:
https://arxiv.org/abs/2309.01029
GitHub鏈接:
https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

10、潞晨與瀾舟將合作打造企業(yè)級LLM解決方案
據(jù)潞晨科技微信公眾號發(fā)文,近日,北京潞晨科技有限公司(簡稱“潞晨科技”)與北京瀾舟科技有限公司(簡稱“瀾舟科技”)達成戰(zhàn)略合作協(xié)議。潞晨科技將以Colossal-AI系統(tǒng)為基礎(chǔ),結(jié)合內(nèi)存管理,多維并行,推理提速等先進技術(shù),幫助瀾舟科技更高效更快速地實現(xiàn)垂類模型落地,使孟子通用大模型、孟子行業(yè)大模型和孟子場景服務(wù)模型等孟子系列大模型更好地服務(wù)行業(yè)頭部和標桿企業(yè),共同推動AI大模型在多個領(lǐng)域的工程化產(chǎn)業(yè)應(yīng)用和落地,積極助力各產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。
11、中國電信在深圳成立含AI軟件業(yè)務(wù)數(shù)智公司
《科創(chuàng)板日報》26日訊,天眼查App顯示,9月25日,中電信數(shù)智科技(深圳)有限公司成立,法定代表人為張宇峰,注冊資本5000萬人民幣,經(jīng)營范圍含軟件開發(fā)、智能控制系統(tǒng)集成、智能無人飛行器銷售、可穿戴智能設(shè)備銷售、5G通信技術(shù)服務(wù)、光通信設(shè)備銷售、人工智能應(yīng)用軟件開發(fā)等。股權(quán)全景穿透圖顯示,該公司由中電信數(shù)智科技有限公司全資持股,后者為中國電信(601728)全資子公司。
12、梅安森計劃推出第一代礦山安全模型
《科創(chuàng)板日報》26日訊,安全領(lǐng)域“物聯(lián)網(wǎng)+”企業(yè)梅安森董事長馬焰在接受《科創(chuàng)板日報》記者采訪時表示,公司從去年開始利用華為盤古大模型和算力,對原有產(chǎn)品進行優(yōu)化,目前已應(yīng)用于項目中。梅安森與上海人工智能研究院共建礦山安全大模型聯(lián)合實驗室,計劃盡快推出第一代針對細分領(lǐng)域問題的礦山安全模型,應(yīng)用于礦山中,并逐步完善。
13、耐能宣布完成9700萬美元B輪融資
據(jù)人工智能公司耐能微信公眾號發(fā)文,今天,耐能宣布從和順興基金、富士康及全科科技等投資者處獲得4900萬美元的戰(zhàn)略融資,使B輪融資總額達到9700萬美元。本輪融資由維港投資領(lǐng)投,光寶科技、威剛科技、富士康及和順興基金等多家公司參投。此次資金,耐能將用于加速先進人工智能的推進,特別關(guān)注汽車領(lǐng)域輕量級GPT的解決方案。據(jù)悉,耐能目前為止的融資總額達到1.9億美元。
14、AI醫(yī)療公司惠每科技宣布完成超3億元D輪融資
據(jù)醫(yī)療AI解決方案提供商惠每科技微信公眾號發(fā)文,今天,惠每科技宣布完成超3億元人民幣的D輪融資,本輪融資由鐘鼎資本領(lǐng)投,潤璋創(chuàng)投、蘇州宜和等知名投資機構(gòu)跟投,老股東啟明創(chuàng)投繼續(xù)投資。泰合資本擔(dān)任本輪融資財務(wù)顧問。
15、諾和諾德合作Valo 基于AI尋求CMD新療法
當?shù)貢r間25日,知名生物制藥公司諾和諾德(Novo Nordisk)于官網(wǎng)宣布與美國科技公司Valo Health合作,將利用Valo公司的Opal計算平臺和患者數(shù)據(jù)集,以實現(xiàn)新型心臟代謝藥物項目的發(fā)現(xiàn)和開發(fā)。Valo將獲得一筆預(yù)付款和一筆潛在的近期里程碑付款,總額為6000萬美元,并且有資格獲得最多11個項目的里程碑付款,總額27億美元,外加研發(fā)資金和潛在的特許權(quán)使用費
16、諾基亞將在迪拜設(shè)實驗室推動AI技術(shù)應(yīng)用
據(jù)外媒ET Telecom報道,諾基亞于當?shù)貢r間周一宣布將在阿聯(lián)酋迪拜設(shè)立一個“開放式創(chuàng)新”實驗室,旨在推動中東非地區(qū)人工智能、機器學(xué)習(xí)等技術(shù)在云無線接入網(wǎng)(C-RAN)、私有無線網(wǎng)絡(luò)、工業(yè)網(wǎng)絡(luò)等領(lǐng)域的應(yīng)用。
17、木頭姐:在AI方面有比英偉達更好的賭注
據(jù)彭博社報道,被稱作“女版巴菲特”的知名基金經(jīng)理、方舟投資(ARK Invest)首席執(zhí)行官“木頭姐”Cathie Wood在慕尼黑的一次投資者會議上稱,在人工智能的指數(shù)級增長方面,有比英偉達更好的選擇,她強調(diào)了另外兩家“不太明顯的”AI軟件公司UiPath和Twilio。據(jù)悉,Wood的旗艦基金ARK Innovation ETF在今年1月減持了英偉達股票,錯過了該芯片制造商估值達到1萬億美元的大部分漲勢。
18、英國政府:AI對多邊體系構(gòu)成了“嚴峻考驗”
據(jù)英國《金融時報》報道,英國政府在近期舉行的聯(lián)合國大會上警告稱,人工智能對多邊體系構(gòu)成了“嚴峻考驗”,并聲稱正在尋求讓包括中國在內(nèi)的國家支持其監(jiān)管該技術(shù)“社會規(guī)?!憋L(fēng)險的愿景。上周,英國副首相Oliver Dowden和外交大臣James Cleverly在聯(lián)合國大會期間接受英國《金融時報》采訪時,為英國邀請中國參加人工智能監(jiān)管峰會的決定進行了辯護,該峰會最初被描述為只包括“志同道合的國家”。