生產(chǎn)力提升30%!微軟最大規(guī)模調研報告出爐,AI工具成打工人效率神器
對于每個打工人來說,AI工具就像小助理,想不出來?要趕deadline?先交給AI頭腦風暴一下。
寫文案可以用AI,做PPT可以用AI,做設計也可以用AI。
AI到底能在多大程度上提升我們的辦公效率?微軟最近搞了一項迄今為止關于工作場景下GenAI的最大規(guī)模研究,涉及來自60多家公司超過6000名員工。
報告地址:https://www.microsoft.com/enus/research/uploads/prodnew/2024/07/Generative-AI-in-Real-World-Workplaces.pdf
微軟于2023年12月發(fā)布了第一份人工智能和生產(chǎn)力報告,報告主要得出了一個結論:AI工具有可能為信息工作者執(zhí)行的任務帶來生產(chǎn)力的階躍函數(shù)提高。
報告地址:https://www.microsoft.com/enus/research/uploads/prod/2023/12/AI-and-Productivity-Report-First-Edition.pdf
半年前的研究主要由基于實驗室的研究組成,在這些研究中,參與者使用生成式人工智能工具在受控的模擬工作環(huán)境中完成研究人員設計的任務。
現(xiàn)在,越來越多的人可以使用生成式人工智能工具,這些工具在實驗室環(huán)境之外、在人們執(zhí)行日常工作時會有什么影響?
因此,第二份Microsoft AI和生產(chǎn)力報告重點關注人們?nèi)绾螌opilot和其他生成式AI工具應用到日常工作中。
場景:工人在工作中使用AI
研究人員與60多個組織(包括各行各業(yè)6000多名員工)合作,對Copilot for Microsoft 365進行了大規(guī)模隨機對照現(xiàn)場實驗,參與者在日常工作中使用AI工具而不是研究人員在實驗室環(huán)境中模擬。
Copilot for Microsoft 365將生成式AI工具結合到了Word、Excel、PowerPoint、Outlook、Teams等應用程序中。
每個組織至少預留50個許可證,隨機分配給該組織指定的100名或更多Microsoft 365用戶。
研究人員使用這些組織中Microsoft 365的元數(shù)據(jù),比較了電子郵件、會議和文檔的使用情況。
研究人員發(fā)現(xiàn),與沒有使用Copilot的人相比,使用Copilot for Microsoft 365的人平均閱讀的個人電子郵件數(shù)量減少了11%,使用郵件的時間減少了4%。
一些企業(yè)電子郵件閱讀量和與寫郵件的時間相對減少了20%或25%。
研究人員推測,Copilot for Outlook中的電子郵件摘要功能和Copilot聊天功能可能允許工作人員檢索信息,而無需閱讀或重讀單封電子郵件。
Copilot對參加會議數(shù)量(通過 Microsoft Teams)的影響更為復雜,增加、減少和基本不變的情況都有出現(xiàn)。
有10個組織的出席會議數(shù)量出現(xiàn)了統(tǒng)計上的顯著減少,平均每天減少0.39次會議,而在Copilot之前平均每天有3次會議。
Teams Copilot提供會議摘要,并使用記錄來回答用戶在會議期間或會議后可能提出的問題,增加可能反映了 Teams Copilot使用的增加,但并不表明總體會議數(shù)量的增加。
在文檔方面,使用Copilot的人比沒有使用Copilot的人創(chuàng)建和編輯了更多的文檔。
總體而言,人們編輯的文檔數(shù)量增加了10%,其中Word、Excel 和 PowerPoint的重度用戶編輯數(shù)量增加了13%,一些企業(yè)的增幅達到25-30%。
Copilot 提供的寫作和創(chuàng)作幫助,使生成和修改輸出變得更容易?;蛘撸藗兛赡軙肅opilot節(jié)省的一些時間來進行其他文檔創(chuàng)建和編輯。
辦公趨勢指數(shù)
為了了解生成式人工智能對工作場所生產(chǎn)力和滿意度的影響,微軟開展了2024年辦公趨勢指數(shù)調查。
這項匿名調查由Edelman Data & Intelligence對31個國家/地區(qū)的3.1萬名全職雇員或個體工作者進行。
該調查旨在廣泛捕獲用戶對生成式人工智能的看法和體驗,而不是關注Copilot等任何特定的生成式人工智能工具。
調查的一項重要發(fā)現(xiàn)是,在使用人工智能的受訪者中,78%的人至少使用了一些其組織未提供的人工智能工具。
這突顯了一個重要現(xiàn)象,即許多員工會主動尋找外部人工智能資源來滿足他們的日常使用需求。
此外,工作趨勢指數(shù)數(shù)據(jù)分析的一個重要焦點是「人工智能高級用戶」,研究人員將其定義為熟悉生成式人工智能、每周至少在工作中使用幾次、每天節(jié)省超過30分鐘的個人。
29%的AI用戶可被歸類為「高級用戶」,他們表示通過使用 AI 每天可以節(jié)省超過30分鐘的時間。
下表展示了每個要素在提高人工智能使用頻率方面有多大幫助,分數(shù)越高表明重要性越高。
在此分析中,分數(shù)范圍從361到882,突出顯示了影響AI高級用戶的重要因素是AI工具豐富和提高工作效率。
并且,調查結果發(fā)現(xiàn),AI工具的影響因職位角色和職能而異,客戶服務和銷售員工的生產(chǎn)力提升最大,而法律專業(yè)人員的改善較小。
AI搜索引擎
搜索是工作流程中的一項常見任務,為了了解人工智能增強搜索的使用與傳統(tǒng)搜索有何不同,研究人員隨機選擇的8萬個樣本,分析了傳統(tǒng)Bing搜索和使用Copilot Bing搜索的不同數(shù)據(jù)。
研究發(fā)現(xiàn),與Bing Copilot的聊天往往集中在與知識工作相關的主題,例如「翻譯和語言學習」、「創(chuàng)意寫作和編輯」以及「編程和腳本編寫」。
總體而言,72.9%的Copilot對話屬于知識工作領域,而Bing搜索會話的這一比例為37%。
然后,研究人員使用GPT-4根據(jù)Anderson和Krathwohl的分類法對與每個搜索會話相關的任務進行分類,該分類法定義了從最低復雜性到最高復雜性的六個類別:記憶、理解、應用、分析、評估和創(chuàng)建。
就完成「記憶」任務來看,超過四分之三的傳統(tǒng)搜索會話是用于完成「記憶」任務,而使用使用Copilo搜索這一比例不到二分之一。
「記憶」和「理解」被歸為低復雜性任務,其余任務則歸為高復雜性任務,結果發(fā)現(xiàn)13.4%的傳統(tǒng)搜索會話和 37%的Copilot會話屬于高復雜性任務。
也就是說,人們常常把人工智能增強搜索用于比傳統(tǒng)搜索更復雜的領域。
研究人員將傳統(tǒng)搜索和Copilot之間任務領域和復雜性的轉變解釋為生成式人工智能的幫助。
多語言環(huán)境
研究人員在多語言環(huán)境中研究Copilot如何促進使用不同母語的同事之間的協(xié)作。
首先,研究人員要求77名母語為日語的人回顧一次用英語錄制的會議。
一半的參與者必須觀看和收聽視頻,另一半可以使用Copilot Meeting Recap,提供人工智能會議摘要以及回答有關會議問題的聊天機器人。
然后,研究人員要求其他83名母語為日語的人回顧一次類似的會議,遵循相同的腳本,但這次會議以日語舉行。同樣,一半的參與者可以使用 Copilot。
對于英語會議,使用Copilot的參與者正確回答有關會議的多項選擇題的比例提高了16.4%,獲得滿分的可能性增加了一倍多。
此外,在比較兩種場景之間的準確性時,使用Copilot聽英語會議的準確率達到了97.5%,比使用標準工具聽母語日語會議的準確率 (94.8%) 略高。
研究人員對在日常工作中使用Copilot的人進行采訪時也提到了Copilot在非母語人士交流中的作用。在跨國公司中,Copilot可以幫助人們進行有效溝通。
總結一下以上的研究報告,微軟強調,在日常工作中使用GenAI可以顯著提高生產(chǎn)力,但同時也承認效果可能會根據(jù)環(huán)境和使用情況而有所不同。進一步的研究將探討企業(yè)如何才能最好地促進人工智能的高效利用。