日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

ResponsibleTA 提升 LLM 可靠性,任務完成更安全、更高效 即時看

2023-06-22 14:10:46來源:ZAKER科技  

機器之心專欄

機器之心編輯部


(相關資料圖)

AI 智能助手照進現實。

近幾個月,ChatGPT、GPT-4 等大語言模型(LLM)展現出突破性的理解、推理、生成、泛化和對齊能力,對各行各業的研究方式和生產效率均帶來廣泛而深遠的變革及影響。此外,LLM 還展現出在真實世界的開放場景中解決復雜問題的能力,使科幻電影中無所不能的 AI 智能助手照進了現實。

在實現自然場景中的任務自動化時,一個復雜的任務往往由多個子任務構成,這需要多個模型或 APIs 的協作。如何確保 LLM 和執行器之間高效、安全、穩定地協同工作,是構建 Responsible AI ,以及讓 LLM 可靠地為人類提供服務的關鍵問題。

為了解決這個問題,來自微軟亞洲研究院的研究團隊提出 Responsible Task Automation ( ResponsibleTA ) 框架,提升 LLM 和執行器之間協同工作的安全性和有效性。

論文鏈接:https://arxiv.org/pdf/2306.01242.pdf

項目主頁:https://task-automation-research.github.io/responsible_task_automation/

方法

本文通過提出一個新的任務自動化框架,通過可行性檢測,完成度檢驗,用戶隱私保護等三個模塊,提高了大語言模型作為任務助手的可靠性,為未來的人機交互提供了一種可行的方式。

該系統框架包含基于 LLM 的中央處理單元、指令執行器、指令可行性預測器、指令完成度檢驗器和安全性保護器。

Responsible Task Automation ( ResponsibleTA ) 框架示意圖

當 ResponsibleTA 接收到復雜任務對應的高層級指令時,安全性檢測自動將包含用戶隱私的命令實體替換成對應的占位符,然后將去隱私化的指令發送給部署在云端的 LLM,LLM 據此規劃實現該負責任務目標的單步指令,然后發送給的部署在本地的執行器實際執行相關操作。從 Responsible AI 的角度出發,該框架賦予 LLM 三個新的能力:

1)可行性預測:ResponsibleTA 框架針對 LLM 和執行器的協同,開發設計了可行性預測模塊。該模塊用于對 LLM 的輸出進行可行性判斷,及時攔截不可行的執行指令,從而規避在執行這些指令的過程中產生的不可控風險。當 LLM 輸出的指令判斷為「不可行」時,可行性預測期會將其分析結果返回給 LLM,并要求其重新進行任務規劃,力求將合理可行性的指令交付給執行器,提升任務自動化的成功率。

2)完成度檢驗:ResponsibleTA 框架設計了一個完成度檢驗器,用于在執行器每次執行結束后自動檢查其執行結果是否符合預期。該模塊根據執行器執行后的即時狀態,判斷 LLM 當前規劃是否完成,并提供及時補救的可能。當執行狀態判定為「未完成」時,完成度檢驗器會要求 LLM 啟動 replanning,使其能夠及時調整任務規劃。

完成度檢驗器和上述可行性預測器,分別在 LLM 輸出指令的執行前后,對指令的合理性和執行的完成性進行校驗,為任務自動化的可靠性提供了雙重保險。

3)用戶隱私保護:ResponsibleTA 框架還設置了用戶隱私保護機制,該機制通過一個本地記憶單元實現。當用戶將高層級命令發送給部署在云端的大語言模型時,ResponsibleTA 中的隱私保護模塊自動將命令中的隱私信息(如:用戶名、密碼、地址等)替換成對應的占位符,而當大語言模型將規劃的低層級指令發送給部署在本地的執行器是,占位符會被自動替換成對應的真實信息。于此方式,用戶的隱私信息僅在本地被存儲和被使用,無需發送至云端,從而避免在傳輸和使用中的不可控風險。

針對 ResponsibleTA 中的可行性預測和完成度檢查功能,其研究團隊在 UI 任務自動化場景下提出并對比了兩種不同的技術路線,并在實驗部分詳細分析了這兩種技術路線的特點。以可行性預測為例,第一種技術方案通過 Prompting 的方式利用大語言模型內部知識進行判斷。具體地,研究者訓練了一個屏幕解析模型將 UI 頁面解析成所含 UI 元素的語言描述,并將和指令一起輸入給 GPT-4 模型,讓 GPT-4 判斷當前指令的可行性。具體方案如下圖所示。

基于 prompt engineering 的(指令)可行性預測器實現方案

另一種技術方案在于訓練一個專用的多模態模型,該模型接收 UI 頁面的視覺信號和對應的語言指令為輸入,輸出該指令的可行性判定結果,具體結構如下圖。

基于專用模型的(指令)可行性預測器實現方案

完成度檢驗器的實現方案于可行性預測器類似,在此不詳細贅述。

實驗

該工作的作者首先對 ResponsibleTA 中的關鍵模塊進行定性實驗,驗證其有效性,并對比不同實現方式的特點。據下表所示實驗結果,作者認為專用模型能夠提供更優的實驗結果但需要收集特定任務對應的數據和標注用于模型訓練,而基于 LLM 的技術方案也能達到不錯的效果,并在實際部署的成本和靈活性方面具有優勢。

可行性預測器和完成度檢驗器的定性實驗結果

作者還在真實世界的實際使用場景中進行 online testing, 并匯報了基線模型,具有可行性預測器的 ResponsibleTA 框架和完整版的 ResponsibleTA 框架在 12 個實際 UI 任務執行過程中的具體表現。作者觀察到所提出的可行性預測器和完成度檢驗器能夠避免執行不可理 / 不可行的指令,并能通過讓 LLM 進行 replanning 的方式進行及時補救,從而提升任務自動化的成功率。

真實世界中實例研究定量結果。表格中的數字表示 「有效執行步數 / 總共執行步數 (人類專家執行步數)」。

此外,作者還通過具體的案例分析直觀地展現了 ResponsibleTA 框架中的關鍵模型如何對一個失敗案例進行補救,使其成為一個成功案例。

案例分析:進入亞馬遜網站并將最便宜的充電器添加至購物車。

THE END

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

国产精品草草| 国产精品亚洲综合久久| 羞羞答答成人影院www| 亚洲一区自拍| 91另类视频| 亚州av日韩av| 偷偷www综合久久久久久久| 日韩成人免费| 国产精品久久| 久久综合国产| 国产美女高潮在线观看| 中文字幕人成人乱码| 久久国产毛片| 亚洲私拍视频| 欧美女王vk| 国产一区成人| 国内在线观看一区二区三区| 久久精品国产大片免费观看| 成人观看网址| 国产一区二区三区亚洲综合 | 国产精品久久久久久久久久白浆| 狠狠爱成人网| 欧美在线免费一级片| 精品大片一区二区| 五月激情久久| 国产伦理久久久久久妇女| 日韩在线一区二区| 国产区精品区| 蜜桃精品视频| 亚洲综合小说| 激情综合网站| 玖玖精品在线| 久久久一二三| 国产福利亚洲| 91精品国偷自产在线电影| 日韩欧美午夜| 亚洲成人黄色| 2019年精品视频自拍| 高潮久久久久久久久久久久久久| 欧美激情偷拍自拍| 日韩视频一二区| 日韩欧美精品综合| 99热这里只有精品首页| 中文字幕在线看片| 亚洲精品在线国产| 亚洲成人a级片| 婷婷激情久久| 日本成人超碰在线观看| 成人av二区| 欧美黄色一区| 日韩综合在线| 久久精品论坛| 日本网站在线观看一区二区三区 | 国产精品视频一区视频二区| 丝袜脚交一区二区| 天堂va欧美ⅴa亚洲va一国产| 成人片免费看| 久久看片网站| 欧美日本中文| 午夜在线视频观看日韩17c| 奇米亚洲欧美| 91九色综合| 99国内精品| 婷婷综合国产| 国产精品综合色区在线观看| 日韩午夜av| 日韩成人一级大片| 色综合视频一区二区三区日韩| 一区二区三区四区在线看| 久久人人爽人人爽人人片av不| 国产精品日韩欧美一区| 99热这里只有精品首页| 久久这里只有| 免费在线看成人av| 黄色成人美女网站| 99精品国产九九国产精品| 在线看片福利| 伊人成年综合电影网| 成人羞羞在线观看网站| 欧美一区免费| 日韩av密桃| 激情欧美亚洲| 亚洲2区在线| 青青草精品视频| 国产精品国内免费一区二区三区| 亚洲视频国产精品| 日本aⅴ免费视频一区二区三区 | 国产精品丝袜在线播放| 日本中文一区二区三区| 首页综合国产亚洲丝袜| 欧美18免费视频| 国产精品密蕾丝视频下载| 婷婷六月国产精品久久不卡| 狠狠久久婷婷| 日韩精品免费一区二区三区| 国产精品亚洲欧美日韩一区在线 | 成人福利一区| 日韩一级在线| 日本成人在线不卡视频| 黄色在线观看www| 欧美精品激情| 黄色免费大全亚洲| 国产精品日本一区二区不卡视频 | 欧美专区一区二区三区| 亚洲不卡av不卡一区二区| 国产精品嫩模av在线| 美女在线视频一区| 日韩大片在线播放| 日韩午夜av在线| 今天的高清视频免费播放成人| 日本一区二区三区播放| 国产videos久久| 亚洲在线久久| 麻豆精品久久精品色综合| 91精品xxx在线观看| 色综合蜜月久久综合网| 伊人久久综合| 黄色成人av网站| 欧美91福利在线观看| 久久精品官网| 亚洲91中文字幕无线码三区| 欧美一区自拍| 精品99在线| 精品免费视频| 久久精选视频| 激情五月***国产精品| 99精品小视频| 欧美午夜精彩| 久久久久久久久久久妇女 | 国产精品美女久久久久久不卡| 你懂的网址国产 欧美| 欧美激情性爽国产精品17p| 日本一区中文字幕| 日韩专区中文字幕一区二区| 日本一区二区中文字幕| 欧美一区在线看| 日本午夜精品视频在线观看 | 午夜精品亚洲| 激情欧美亚洲| 日韩精品久久理论片| 欧美成a人片免费观看久久五月天 日本中文字幕视频一区 | 久久激情网站| re久久精品视频| 最新精品国产| 亚洲综合精品四区| 欧美1区2区| 中日韩男男gay无套| 久久最新视频| 91欧美大片| 先锋欧美三级| 日韩专区中文字幕一区二区| 亚洲色图网站| 日本最新不卡在线| 欧美日韩导航| 蜜桃国内精品久久久久软件9| 在线电影一区二区| 丝袜国产日韩另类美女| 日本蜜桃在线观看视频| 欧美视频免费看| 亚洲精品专区| 日韩福利电影在线| 久久91在线| 91久久夜色精品国产九色| 先锋影音国产一区| 88xx成人免费观看视频库| 国产成人精品一区二区三区在线| 久久一综合视频| 日韩精品福利一区二区三区| 精品视频免费| 欧美日韩三级电影在线| 色一区二区三区四区| 四虎4545www国产精品| 日本在线播放一区二区三区| 欧美欧美黄在线二区| 精品国产午夜肉伦伦影院| 欧美在线影院| 日韩久久一区二区三区| 亚洲综合激情在线| www.久久东京| 国产亚洲一区在线| 成人国产精品| 欧美日本三级| 99久久久国产精品美女| 视频一区在线播放| 福利一区和二区| 亚洲区小说区图片区qvod按摩| 色综合久久中文| 亚洲黄色免费看| 国一区二区在线观看| 久久99偷拍| 国产欧洲在线| 中文在线日韩| 999成人精品视频线3| 国产精品久久久久久久久妇女| 日本在线不卡一区| 精品精品国产三级a∨在线| 国产精品久久久久久| 亚洲欧洲一二区| 偷偷www综合久久久久久久| 欧美aaa视频|