|
#人工智能 阿里云推出通義千問 Qwen2 系列模型,阿里完全開源,云開源通義千提供 0.5B~72B 之間 5 個版本,問Q文測網(wǎng)鄭州金水酒店上門服務(wù)外圍女兼職vx《134+8006/5952》提供外圍女上門服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)在各項評測中表現(xiàn)不俗。上下試中有興趣的表現(xiàn)不俗開發(fā)者現(xiàn)在就可以通過 GitHub 等平臺獲取最新模型。查看全文:https://ourl.co/104358 阿里云今天推出了通義千問人工智能模型的藍(lán)點重大升級版本:Qwen2,該模型提供 5 個不同的阿里尺寸、上下文長度最高支持 128K tokens,云開源通義千并且在各項測試中表現(xiàn)不俗。問Q文測網(wǎng) Qwen2 的上下試中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上開源,表現(xiàn)不俗有興趣的藍(lán)點開發(fā)者可以立即獲取模型進(jìn)行測試。
此次發(fā)布的阿里新版本亮點包括:
在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低顯存的占用。 同時諸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的設(shè)備上運行,例如在智能手機本地運行 Qwen2-0.5B 而不需要云端處理,這種也是未來的趨勢,未來可能所有智能設(shè)備都會支持 AI,這就需要更小的模型為本地運行提供支持。 模型評估顯示 Qwen2 能力超過 Llama3: 目前人工智能開源 / 開放社區(qū)中最重要的兩個貢獻(xiàn)者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本為 Llama3。 在開源 / 開放模型能力評測中,Qwen2-72B 版在各方面超過 Llama3-70B,也超過了 Mixtral-8x22B,所以現(xiàn)在壓力給到了 Meta,不知道 Meta 什么時候發(fā)布新版本。
阿里云 AI 團(tuán)隊表示: 大規(guī)模預(yù)訓(xùn)練后,我們對模型進(jìn)行精細(xì)的微調(diào),以提升其智能水平,讓其表現(xiàn)更接近人類。這個過程進(jìn)一步提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。此外,模型學(xué)會對齊人類價值觀,它也隨之變得更加對人類有幫助、誠實以及安全。我們的微調(diào)過程遵循的原則是使訓(xùn)練盡可能規(guī)模化的同時并且盡可能減少人工標(biāo)注。我們探索了如何采用多種自動方法以獲取高質(zhì)量、可靠、有創(chuàng)造力的指令和偏好數(shù)據(jù),其中包括針對數(shù)學(xué)的拒絕采樣、針對代碼和指令遵循的代碼執(zhí)行反饋、針對創(chuàng)意寫作的回譯、針對角色扮演的 scalable oversight、等等。在訓(xùn)練方面,我們結(jié)合了有監(jiān)督微調(diào)、反饋模型訓(xùn)練以及在線 DPO 等方法。我們還采用了在線模型合并的方法減少對齊稅。這些做法都大幅提升了模型的基礎(chǔ)能力以及模型的智能水平。 限時活動推薦:軟購618多款正版軟件2折購、QQ超會15月108元、B站大會員88元、騰訊視頻128元、愛奇藝138元。 |





