欧美精品v日韩精品v国产精品_全免费a级毛片免费看不卡_91精品国产91热久久久久福利_成人毛片免费观看视频在线

環(huán)球焦點!谷歌又鬧大烏龍 Jeff Dean參與的新模型竟搞錯Hinton生日

來源:新智元

最近,谷歌研究員發(fā)布了關(guān)于指令微調(diào)的最新工作!然而卻宣傳圖中出現(xiàn)了可笑的烏龍。幾個小時之前,谷歌大腦的研究員們非常開心地曬出了自己最新的研究成果:“我們新開源的語言模型Flan-T5,在對1,800多種語言的任務進行指令微調(diào)后,顯著提高了prompt和多步推理的能力。”


然而,就在這張精心制作的“宣傳圖”上,竟藏著一個讓人哭笑不得的bug!


(資料圖片僅供參考)


請注意看Geoffrey Hinton的出生日期:


但實際上,Hinton出生于1947年……


雖然沒有必然聯(lián)系,但是Google自己的模型,竟然會把自家大佬的生日搞錯?

馬庫斯同志看完直接就驚了:你們Google,沒人負責審核的嗎……


理論上,這篇擁有31位作者,外加Jeff Dean這種大佬參與的論文,不應該發(fā)生這種“低級錯誤”才對啊。


“復制”的時候“打錯了”而已!

很快,論文的共同一作就在馬庫斯的推文下面進行了回復:“我們都知道,模型的輸出并不總是符合事實。我們正在進行負責任的AI評估,一旦有了結(jié)果,我們將立即更新論文。”


沒過多久,這位作者刪除了上面那條推文,并更新留言稱:“這只是在把模型的輸出復制到Twitter上時,『打錯了』而已。”


對此,有網(wǎng)友調(diào)侃道:“不好意思,你能不能給我翻譯翻譯,什么叫『復制』來著?”


當然,在查看原文之后可以發(fā)現(xiàn),“圖1”所示的生日,確實沒錯。

至于在宣傳圖中是如何從“1947”變成“1963”的,大概只有做圖的那位朋友自己知道了。


隨后,馬庫斯也刪除了自己的這條推文。


世界重歸平靜,就像什么也沒有發(fā)生一樣。

只留下Google研究員自己推文下面的這條在風中飄搖——


擴展指令微調(diào)語言模型

既然誤會解除了,我們就讓話題重新回到論文本身上來吧。

去年,Google推出了一個參數(shù)量只有1370億的微調(diào)語言網(wǎng)絡FLAN(fine-tuned language net)。


https://arxiv.org/abs/2109.01652

FLAN是Base LM的指令調(diào)優(yōu)(instruction-tuned)版本。指令調(diào)優(yōu)管道混合了所有數(shù)據(jù)集,并從每個數(shù)據(jù)集中隨機抽取樣本。

研究人員稱,這種指令調(diào)節(jié)(instruction tuning)通過教模型如何執(zhí)行指令描述的任務來提高模型處理和理解自然語言的能力。

結(jié)果顯示,在許多有難度的基準測試中,F(xiàn)LAN的性能都大幅超過了GPT-3。


這次,Google將語言模型進行拓展之后,成功刷新了不少基準測試的SOTA。

比如,在1.8K任務上進行指令微調(diào)的Flan-PaLM 540B,性能明顯優(yōu)于標準的PALM 540B(平均 + 9.4%),并且在5-shot的MMLU上,F(xiàn)lan-PaLM也實現(xiàn)了75.2%的準確率。

此外,作者還在論文中公開發(fā)布Flan-T5檢查點。即便是與更大的模型(如PaLM 62B)相比,F(xiàn)lan-T5也能實現(xiàn)強大的小樣本性能。


論文地址:https://arxiv.org/abs/2210.11416

總結(jié)來說,作者通過以下三種方式擴展了指令微調(diào):

擴展到540B模型

擴展到1.8K的微調(diào)任務

在思維鏈(CoT)數(shù)據(jù)上進行微調(diào)

作者發(fā)現(xiàn)具有上述方面的指令微調(diào)顯著提高了各種模型類(PaLM、T5、U-PaLM)、prompt設置(zero-shot、few-shot、CoT)和評估基準(MMLU、BBH、 TyDiQA、MGSM、開放式生成)。


這次的微調(diào)數(shù)據(jù)包括473個數(shù)據(jù)集、146個任務類別和1,836個總?cè)蝿铡?/p>

作者是通過結(jié)合之前工作中的四種混合(Muffin、T0-SF、NIV2 和 CoT),縮放(scale)成了下圖中的1836個微調(diào)任務。


在研究中,微調(diào)數(shù)據(jù)格式如下圖這樣組合。研究者在有樣本/無樣本、有思想鏈/無思想鏈的情況下進行了微調(diào)。要注意的是,其中只有九個思維鏈(CoT)數(shù)據(jù)集使用CoT格式。


第四種微調(diào)數(shù)據(jù)的混合涉及CoT注釋,作者用它來探索CoT注釋的微調(diào)是否可以提高看不見的推理任務的性能。

作者從先前的工作中創(chuàng)建了9個數(shù)據(jù)集的新混合,然后由人類評估者手動為訓練語料庫編寫CoT注釋。這9個數(shù)據(jù)集包括算數(shù)推理、多跳推理(multi-hop reasoning)和自然語言推理等。

作者在廣泛的模型中應用了指令微調(diào),包括T5、PaLM和U-PaLM。對于每個模型,作者都采用了相同的訓練過程,使用恒定的學習率,并使用Adafactor優(yōu)化器進行了微調(diào)。

從下表中可以看出,用于微調(diào)的計算量僅占訓練計算的一小部分。


作者根據(jù)模型的大小和微調(diào)任務的數(shù)量,在保留任務的性能上檢測了縮放的影響。

作者從對三種大小的PaLM模型(8B/62B/540B)進行實驗,從任務最少的混合開始,一次添加任務混合,然后再到任務最多的混合(CoT、Muffin、T0-SF 和 NIV2)。

作者發(fā)現(xiàn),擴展指令微調(diào)后,模型大小和任務數(shù)量的擴展都會大大改善性能。

是的,繼續(xù)擴展指令微調(diào)就是最關(guān)鍵的要點!

不過,在282個任務之后,收益開始略微變小。


從下表中可以看出,對于三種大小的模型,多任務指令微調(diào)后,相比沒有微調(diào)時,性能有很大的提高,性能增益范圍從9.4%到15.5%。

其次,增加微調(diào)數(shù)量可以提高性能,盡管大部分的改進來自282個任務。

最后,將模型規(guī)模增加一個數(shù)量級(8B→62B或62B→540B)會顯著提高微調(diào)和非微調(diào)模型的性能。


為什么282個任務之后增益就變小了呢?有兩種解釋。

一是附加任務不夠多樣化,因此沒有為模型提供新知識。

二是多任務指令微調(diào)的大部分收益,是因為模型學習更好地表達了它在預訓練中已經(jīng)知道的知識,而282個以上的任務并沒有太大的幫助。

另外,作者還探討了在指令微調(diào)混合中包含思想鏈(CoT)數(shù)據(jù)的效果。


可以看出,F(xiàn)lan-PaLM在所有評估基準上都優(yōu)于PaLM。

不過令人驚訝的是,以前的指令微調(diào)方法(如FLAN,T0)顯著降低了non-CoT的性能。

對此的解決方案是,只需在微調(diào)混合中添加9個CoT數(shù)據(jù)集,就可以在所有評估中獲得更好的性能。


雖然思維鏈(Chain-of-Thought)prompting通常非常有效,但只能編寫少量樣本,而且零樣本CoT并不總是有效果。

而Google研究者的CoT微調(diào)顯著提高了零樣本推理能力,比如常識推理。


為了展示方法的通用性,研究人員訓練了T5、PaLM和U-PaLM。其中參數(shù)量的覆蓋范圍也非常廣,從8000萬到5400億。

結(jié)果證明,所有這些模型都得到了顯著提升。


在以往,開箱即用的預訓練語言模型可用性通常都很差,比如對輸入的prompt沒有反應。

Google的研究者要求人類評估者來評估開放式生成問題的“模型可用性”。

結(jié)果顯示,F(xiàn)lan-PaLM 的可用性比PaLM基礎(chǔ)模型要高79%。


此外,指令微調(diào)還補充了其他的模型適應技術(shù),比如UL2R。

同樣的,F(xiàn)lan-U-PaLM取得了很多優(yōu)秀的結(jié)果。


論文地址:https://arxiv.org/abs/2210.11399

Google的另一起“翻車”事件

可以說,剛剛發(fā)生的這個劇情,既視感相當強了!

沒錯,就在10月19日,當GooglePixel的官方賬號試圖挖苦蘋果CEO庫克時,被網(wǎng)友抓包:是用iPhone發(fā)的推文……


顯然,這種事情早已不是第一次了。

2013年,T-Mobile的CEO就在Twitter上對三星Note 3贊不絕口,但用的是iPhone。

同樣是2013年,黑莓的創(chuàng)意總監(jiān)Alicia Keys在發(fā)布會上說,她已經(jīng)拋棄了自己之前的iPhone,換了黑莓Z10。隨后,就被發(fā)現(xiàn)用iPhone發(fā)推,甚至在被抓到后發(fā)推狡辯說是因為自己被黑了。

三星,也不例外:


而且,相比于Google的這次刪推,三星當時做得更加決絕:直接刪號!


看來,營銷課程有必要加上這樣的一條戒律了:如果你要推廣一個產(chǎn)品,請不要用競爭對手的產(chǎn)品來做。

這并不是一個難以傳授的信息,甚至還可以做得直白:在推銷其他產(chǎn)品時,手里請不要拿著iPhone。

關(guān)鍵詞: Google 谷歌又鬧大烏龍 Jeff Dean參與的新模型竟

推薦

直播更多》

關(guān)閉

資訊更多》

焦點

欧美精品v日韩精品v国产精品_全免费a级毛片免费看不卡_91精品国产91热久久久久福利_成人毛片免费观看视频在线

狠狠久久亚洲欧美| 亚洲人成小说网站色在线| 亚洲制服丝袜av| 欧美一区二区视频在线观看2022 | 欧美少妇一区二区| 国产亚洲短视频| 日韩成人免费电影| 久久久久国产精品人| 亚洲成av人**亚洲成av**| 精品国产一区二区三区四区四| 一区二区久久久久| proumb性欧美在线观看| 亚洲国产精品影院| 欧美精品一区二区三区蜜臀| 亚洲成人一区二区| 久久综合色婷婷| 婷婷丁香激情综合| 国产精品午夜免费| 国产在线精品免费| 一区二区三区影院| www激情久久| 美女视频黄 久久| 国产精品国产三级国产专播品爱网 | 亚洲三级在线免费观看| 国产a视频精品免费观看| 亚洲精品国产品国语在线app| 欧美一二三在线| 天堂蜜桃91精品| 国产日韩成人精品| 欧美一卡2卡三卡4卡5免费| 亚洲电影第三页| 国产午夜精品久久| 欧美剧情电影在线观看完整版免费励志电影 | 日本道精品一区二区三区| 亚洲欧洲成人av每日更新| 国产成人在线视频播放| 亚洲成a人片在线不卡一二三区| 日本一二三不卡| 国产91综合网| 一本久道中文字幕精品亚洲嫩| 亚洲欧美在线观看| 99国产精品99久久久久久| 欧美日韩小视频| 亚洲电影你懂得| 国产精品久久久爽爽爽麻豆色哟哟| 日韩欧美一区在线| 久久精品99国产国产精| 一区二区日韩电影| 国产精品久久久久一区二区三区 | 久久精品亚洲精品国产欧美| 91精品国产手机| 男女激情视频一区| 亚洲久本草在线中文字幕| 国产日韩精品一区二区三区在线| 国产精品66部| 欧美中文字幕一区二区三区亚洲 | 亚洲综合区在线| 国产精品麻豆视频| 26uuu精品一区二区| 欧美一区二区观看视频| 久久电影网站中文字幕| 亚洲成人动漫一区| 一区二区三区四区蜜桃| 亚洲国产精品激情在线观看| 久久伊人中文字幕| 成人爱爱电影网址| 91精品国产综合久久蜜臀| 麻豆成人免费电影| 亚洲成人1区2区| 亚洲一区在线看| 中文字幕综合网| 亚洲天堂2016| 中文字幕不卡在线观看| 国产欧美日韩在线| 91免费观看在线| 精品国产露脸精彩对白| 成人自拍视频在线观看| 欧美精品久久99久久在免费线| 美国一区二区三区在线播放| 偷拍亚洲欧洲综合| 午夜一区二区三区视频| 一区二区成人在线视频| 亚洲综合激情网| 亚洲欧美一区二区三区久本道91 | 中文字幕一区二区视频| 国产欧美日韩视频在线观看| 久久久九九九九| 久久综合精品国产一区二区三区| 精品国产91久久久久久久妲己 | 高清成人免费视频| 欧美一区二区三区公司| 国产精品12区| 欧美一区二区三区思思人| 国产精品系列在线观看| 91精品国产综合久久香蕉的特点 | 在线亚洲一区二区| 麻豆国产精品一区二区三区| 在线免费视频一区二区| 久久99久久久欧美国产| 欧美伦理电影网| 国产高清久久久| 日韩精品专区在线| 99久久国产综合色|国产精品| 久久久久久久久久久久久久久99| www国产成人免费观看视频 深夜成人网| 久久久久国产精品厨房| 欧美激情一二三区| 亚洲男人的天堂av| 一区二区视频在线| 日产欧产美韩系列久久99| 在线一区二区三区做爰视频网站| 狠狠色狠狠色综合日日91app| 欧美一区二区美女| 91在线观看视频| 国产精品福利av| 亚洲精品国产高清久久伦理二区| 天天亚洲美女在线视频| 欧美中文字幕亚洲一区二区va在线| 国产一区二区福利视频| 精品欧美乱码久久久久久| 国产亚洲精品福利| 一区二区三区在线视频免费观看| 亚洲高清不卡在线| 韩国精品一区二区| 精品国产乱子伦一区| 欧美精彩视频一区二区三区| 亚洲综合免费观看高清在线观看| 色综合久久天天综合网| 国产成人综合网站| 国产日韩欧美制服另类| 亚洲人成网站精品片在线观看 | 亚洲欧美日韩国产成人精品影院 | 天天色综合天天| 欧美久久久一区| 久久伊人蜜桃av一区二区| 亚洲日本va在线观看| 色综合夜色一区| 成人综合在线观看| 国产精品女同一区二区三区| 亚洲午夜影视影院在线观看| 久久精品国内一区二区三区| 精品日韩在线一区| 国产精品久久久久久久第一福利| 午夜精品福利一区二区蜜股av| 欧美精品在线一区二区三区| 久久亚洲精华国产精华液| 亚洲在线视频网站| 欧美剧情片在线观看| 久久久精品综合| 五月婷婷欧美视频| 日韩一区二区免费在线观看| 中文字幕av一区 二区| 日本不卡视频在线| 精品对白一区国产伦| 亚洲另类一区二区| 国产一区二区福利| 国产精品久久看| 日本精品一级二级| 久久亚洲一级片| 五月婷婷综合在线| 欧美大度的电影原声| 亚洲欧洲精品天堂一级| 九九在线精品视频| 久久精品欧美一区二区三区不卡 | 国产精品成人在线观看| 久久精品国产秦先生| 日本一区二区视频在线| 亚洲成人在线免费| 91丨porny丨最新| 亚洲高清免费在线| 精品日韩一区二区| 亚洲一区二区三区四区在线| a在线播放不卡| 亚洲成av人在线观看| 精品久久久久久久久久久久包黑料 | 亚洲欧美日韩国产成人精品影院| 欧美日韩一区二区三区在线看| 国产亚洲精品超碰| 久久97超碰色| 亚洲视频一区二区在线观看| 911精品国产一区二区在线| 国产精品福利影院| 国产精品88av| 亚洲永久精品大片| 久久综合久久综合九色| 天天影视涩香欲综合网| 久久久久久免费| 韩国精品主播一区二区在线观看| 国产精品成人免费在线| 91麻豆精品国产| 怡红院av一区二区三区| 96av麻豆蜜桃一区二区| 奇米精品一区二区三区四区| 中文天堂在线一区| 在线成人av影院| 亚洲一区二区三区美女| 久久久久久久久久久久久久久99 | 精品国产乱码久久久久久久 | 午夜精品久久久久久不卡8050| 久久免费电影网|