「AI新青年講座」由智東西公開課出品,致力于邀請青年學者,主講他們在生成式AI、LLM、計算機視覺、機器學習等人工智能領域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進對人工智能前沿研究的理解,相應領域的專業(yè)知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學習和應用AI的過程中遇到的問題,也能夠盡快解決。
7月起,AI 新青年講座開辟推出「大型語言模型專場」。阿卜杜拉國王科技大學在讀博士朱德堯、新加坡國立大學在讀博士薛復昭、美國威斯康星大學麥迪遜分校在讀博士柳昊天和加州大學伯克利分校人工智能實驗室(BAIR)在讀博士張?zhí)炀鶎⑴c此次專場。
四位 AI 新青年將分別針對 MiniGPT-4、LLaVA、Gorilla,以及大型語言模型所面臨的 Token 危機進行直播講解。
近來,大型語言模型備受關注,ChatGPT 和 GPT-4 都展現(xiàn)了非常令人吃驚的能力,在聊天對話、數(shù)學推理和代碼生成等方面尤為顯著。但 LLM 依然受限于一個固定的權重集內可存儲的信息以及它們可使用一個靜態(tài)的計算圖(computation graph)和有限上下文所能計算的東西。在通過 API 調用使用工具時,它們無法生成準確的輸入參數(shù),并且容易產生錯誤的API調用用法幻覺。
ToolFormer等文章為大家展現(xiàn)了一個語言模型和工具互動的范例,但其實用的工具非常局限。來自加州大學伯克利分校人工智能實驗室(BAIR)和微軟研究院的研究者們提出了一個和 1600+ API互動的語言模型:Gorilla。該模型基于 LLaMA 進行微調,能根據用戶輸入的自然語言為用戶選擇合適的 API 來執(zhí)行對應任務。理論上講,這個模型可以根據用戶需求調用其它各種 AI 模型,因此 Gorilla 有望成為一個統(tǒng)御其它 AI 的 AI 模型。

為了評估模型的能力,研究者們還推出了 APIBench。這是一個包含 HuggingFace、TorchHub 和 TensorHub API 的全面數(shù)據集。而 Gorilla 在 HuggingFace,Tensor Hub 和 Torch Hub 上的表現(xiàn)都超過了 GPT-4,在很大程度上也減少了語言模型的幻想,能更準確的使用 API。
Gorilla:https://github.com/ShishirPatil/gorilla/
7月26日上午10點,Gorilla 一作、加州大學伯克利分校人工智能實驗室(BAIR)在讀博士張?zhí)炀?,將圍繞主題《Gorilla:鏈接海量API的大型語言模型》對 Gorilla 進行深度講解。
第四講
主 題
《Gorilla:鏈接海量API的大型語言模型》
提 綱
1、LLM 與 API 交互的研究
2、LLM 調用 API 和 Service 的局限性
3、針對 API 調用任務微調的 LLaMA-7B 模型: Gorilla
4、在TorchHub、TensorHub 和 HuggingFace 上的應用表現(xiàn)
主 講 人
張?zhí)炀又荽髮W伯克利分校人工智能實驗室(BAIR)在讀博士;導師是joseph gonzalez教授;研究方向主要涉及強化學習以及強化學習在語言模型/多模態(tài)模型中的應用;和sergey levine教授、pieter abbeel教授、denny zhou博士以及yuandong tian博士都有深度合作;曾在Meta AI Research和Google Brain實習,近期的研究主要集中于基于語言模型的自動化。
直 播 時 間
7月26日10:00