AI大模型在GIS中的應(yīng)用
?前言
依稀記得十年前,我在上遙感概論專業(yè)課時(shí),老師帶我們用ERDAS IMAGINE遙感圖像處理軟件做地物分類,每個(gè)人電腦上先發(fā)一段區(qū)域的遙感影像,進(jìn)行人工判讀和標(biāo)注,比如把這個(gè)區(qū)域影像上的林地標(biāo)注出來喂給模型,再用這個(gè)模型去識(shí)別另外一個(gè)區(qū)域影像中的林地,機(jī)器學(xué)習(xí)中典型的的有監(jiān)督學(xué)習(xí)應(yīng)用。
大概5年前,在和公司研發(fā)人員閑聊時(shí),聊到公司在做的“三調(diào)”項(xiàng)目,公司數(shù)據(jù)工程師當(dāng)時(shí)正日夜對(duì)著國家下發(fā)的衛(wèi)星影像,進(jìn)行地物分類和矢量化的工作,不可謂不辛苦。當(dāng)時(shí)和研發(fā)討論這個(gè)工作應(yīng)該交給AI來做,至少先讓AI對(duì)全國遙感影像做一遍再交給人工檢查核對(duì)。純?nèi)斯とプ龅匚镒R(shí)別太慢了、成本太大,加上每個(gè)人對(duì)地物的理解還不一樣,人工判讀地物特征很容易出錯(cuò),非??简?yàn)數(shù)據(jù)工程師的經(jīng)驗(yàn)和責(zé)任心。
SuperMap iDesktopX 11i(2024)-機(jī)器學(xué)習(xí)
現(xiàn)在來看,這類有監(jiān)督學(xué)習(xí)的模型沒有大規(guī)模應(yīng)用,一是標(biāo)注成本太高而且準(zhǔn)確率一般。二是模型泛化性太差,可能在南方某區(qū)域訓(xùn)練的拿到北方去用就不好使了。
在當(dāng)時(shí),全國這么大范圍的遙感影像地物識(shí)別,想著這個(gè)工作應(yīng)該互聯(lián)網(wǎng)科技巨頭可以做好,例如谷歌。
簡(jiǎn)單解釋一下提到的幾個(gè)概念:
“三調(diào)”:是指中國的第三次全國國土調(diào)查,說白了就是查清全國每塊土地的現(xiàn)狀,這塊地是耕地,那塊地是居住用地,形成一張全國土地現(xiàn)狀的數(shù)據(jù)庫。
地物分類:網(wǎng)上找了一張圖,大概過程就是拿著國家下發(fā)的衛(wèi)星影像,使用專業(yè)的GIS軟件,根據(jù)經(jīng)驗(yàn)進(jìn)行地物的識(shí)別,把各種地物的邊緣輪廓給勾勒出來形成一個(gè)閉合的面,然后賦予它的地類屬性,存到空間數(shù)據(jù)庫。比如下面這張圖,紅色是我描的,這塊地應(yīng)該是水田?!叭{(diào)”工作對(duì)全國960萬平方公里的土地進(jìn)行上述過程。
地物分類的過程像AI里面的人工標(biāo)注數(shù)據(jù)。
GIS(地理信息系統(tǒng))軟件是一種用于處理和分析地理數(shù)據(jù)的工具。簡(jiǎn)單來說,它幫助我們以地圖的形式查看和理解數(shù)據(jù),比如分析人口分布、規(guī)劃城市道路或者研究環(huán)境變化。手機(jī)中最常使用的地圖軟件、定位功能,就使用了GIS相關(guān)技術(shù)。
大模型的出現(xiàn)深刻改變著我們的生活,也正深刻改變著GIS。
交互層面的革新
GeoForge是由Ageospatial公司開發(fā)的一個(gè)基于大語言模型(GeoLLMs)的地理空間分析平臺(tái)。GeoForg的目的是使每個(gè)人都可以輕松進(jìn)行地圖繪制和地理空間分析,無論您是外行還是專家。
下面是它的錄屏,從錄屏可以看出,交互基本由自然語言進(jìn)行。
ArcGIS做的AI助手:
而現(xiàn)在的GIS軟件界面長(zhǎng)這樣,跟一般的生產(chǎn)力工具軟件界面差不多。
ArcGIS Pro
QGIS
在這一波大模型的影響下,GIS軟件也將由圖形用戶界面(GUI)向自然語言交互界面演進(jìn)。
最近在使用Claude、ChatGPT出的畫布模式,給了我一些啟發(fā)。ChatGPT canvas在原先對(duì)話框交互的基礎(chǔ)上增加了畫布,在遇到文字編輯和代碼編寫時(shí)會(huì)自動(dòng)彈出畫布進(jìn)行進(jìn)一步展示和編輯,整體界面上還是保持簡(jiǎn)單。
未來當(dāng)我們打開GIS軟件時(shí),應(yīng)該是一個(gè)被大模型深度賦能的軟件。
左側(cè)可能是一個(gè)對(duì)話框,通過自然語言交互,支持文字或語音輸入,它能理解用戶的請(qǐng)求,知道如何使用GIS軟件的每個(gè)功能、地理專業(yè)術(shù)語。
對(duì)于不懂如何使用的操作、技巧、遇到的問題,可以隨時(shí)呼出大模型進(jìn)行解答。
中間是一個(gè)地圖,由于GIS軟件的大部分操作都是圍繞地圖展開,地圖相當(dāng)于畫布。
工具箱和上方導(dǎo)航欄的軟件操作可能是隱藏起來的。
大模型賦能的應(yīng)用
下面我將就具體例子說一下我看到的和想到的。
地圖制圖:
套用今年很火的Agent概念,GIS領(lǐng)域的復(fù)雜任務(wù)自動(dòng)化處理和分析將得到增強(qiáng)。
如今年中國地質(zhì)大學(xué)提出的制圖MapGPT,利用大模型的推理能力,根據(jù)用戶請(qǐng)求,對(duì)任務(wù)進(jìn)行規(guī)劃分解并調(diào)用一系列的制圖工具完成自動(dòng)化制圖。
地圖初始化??添加地圖圖層??修改地圖元素參數(shù)??添加地圖元素??保存輸出地圖。
把繁瑣的操作交給大模型,用戶只發(fā)出指令-確認(rèn)成果-修改-再發(fā)出修改指令,人機(jī)工協(xié)作,減輕工作量。
圖片
最近極海王昊老師使用大模型來生成各種風(fēng)格的地圖,還挺有啟發(fā)的,我也對(duì)著照做了一遍,過程如下 ?現(xiàn)代與傳統(tǒng)GIS的爭(zhēng)論已經(jīng)不重要
1.找一張參考地圖的樣式,將這張圖片發(fā)給多模態(tài)大模型(GPT-4o等),讓它分析地圖樣式并生成對(duì)應(yīng)的json文件
2.找一個(gè)支持Google地圖樣式的網(wǎng)站,粘貼剛剛生成的json文件
3.生成效果如下:
對(duì)于地圖制圖,我覺得還可以嘗試?yán)梦纳鷪D模型來提供創(chuàng)意,幫助生成更好看的地圖。
屬性表的操作:
屬性表的操作,這是GIS軟件一個(gè)很重要的功能,本質(zhì)上是寫SQL語句對(duì)屬性表的數(shù)據(jù)做增刪改查,為了降低普通用戶操作數(shù)據(jù)庫表的難度,GIS軟件提供了一些的操作功能來降低SQL的門檻。這里還可以進(jìn)一步降低門檻,那就是利用NL to SQL的技術(shù),直接把自然語言轉(zhuǎn)成SQL進(jìn)行數(shù)據(jù)的增刪改查操作。
類似于這張圖:
ModelBuilder(模型構(gòu)建器):
熟悉GIS軟件的應(yīng)該都知道,模型構(gòu)建器將一系列地理處理工具串聯(lián)在一起,以可視化編程的方式處理重復(fù)、復(fù)雜的處理任務(wù)。
可以借助大模型的推理能力進(jìn)行空間計(jì)算任務(wù)的自動(dòng)編排,這篇文章的最后具體闡述了實(shí)現(xiàn)過程。
就我個(gè)人看到的廠商例子和實(shí)踐而言,目前這個(gè)階段想讓大模型依靠自身的推理能力完成比較復(fù)雜的GIS任務(wù)規(guī)劃,是比較困難的。也許未來使用強(qiáng)化學(xué)習(xí)、思維鏈訓(xùn)練的o1模型可以,也許我們需要GIS領(lǐng)域的思維鏈來對(duì)大模型做微調(diào)訓(xùn)練。
所以今年很多廠商都推出了基于工作流的智能體構(gòu)建,就是為了應(yīng)對(duì)各專業(yè)領(lǐng)域復(fù)雜問題,如扣子這種大模型應(yīng)用構(gòu)建平臺(tái)。其實(shí)跟上面介紹的模型構(gòu)建器很像,只不過扣子是圍繞大模型的能力展開,用低代碼的方式串聯(lián)工具和大模型來處理復(fù)雜任務(wù),構(gòu)建應(yīng)用。模型構(gòu)建器是圍繞空間分析算子的能力展開。
兩個(gè)類似功能的產(chǎn)品使用下來,還是扣子使用起來簡(jiǎn)單,尤其有一個(gè)小功能對(duì)小白來說很適合,在代碼節(jié)點(diǎn),可以隨時(shí)呼出AI,幫你寫代碼節(jié)點(diǎn)中的處理邏輯代碼,非常實(shí)用。
還有發(fā)布智能體、工作流模板到社區(qū),可以分享給他人使用,交流使用技巧,賺積分等等,玩法多樣,對(duì)于活躍社區(qū),促進(jìn)軟件使用交流很有幫助。對(duì)于GIS軟件來說也是很有借鑒意義。
當(dāng)然了,現(xiàn)在的大模型,配置一般的電腦很難帶得動(dòng),可以考慮在GIS軟件上做一個(gè)設(shè)置,這個(gè)設(shè)置可以連接云端的通用大模型API和對(duì)應(yīng)的key,類似于之前體驗(yàn)的沉浸式翻譯插件的做法,提供配置API key的功能 ?用了就離不開的網(wǎng)頁翻譯插件,沉浸式翻譯使用體驗(yàn)
對(duì)于可以聯(lián)通互聯(lián)網(wǎng)的用戶,設(shè)置自己的大模型API key,用多少token,出多少token錢。
在內(nèi)網(wǎng)的用戶,可以連接內(nèi)網(wǎng)部署的大模型。
當(dāng)然了,為了方便,GIS廠商可以設(shè)置一定的免費(fèi)額度或者包月的形式提供給用戶,免去設(shè)置API的麻煩。
遙感影像、視頻識(shí)別:?
最近,深度學(xué)習(xí)之父辛頓拿了諾貝爾物理學(xué)獎(jiǎng),看了辛頓老爺子的簡(jiǎn)史,2012年10月,辛頓團(tuán)隊(duì)在佛羅倫薩舉行的計(jì)算機(jī)視覺會(huì)議上介紹了冠軍算法AlexNet,相比谷歌貓用了16000顆CPU,AlexNet只用了4顆英偉達(dá)GPU,學(xué)術(shù)界和產(chǎn)業(yè)界徹底轟動(dòng),AlexNet的論文成為計(jì)算機(jī)科學(xué)史上最有影響力的論文之一。
所以在2014年,我們上大學(xué)時(shí)用機(jī)器學(xué)習(xí)的遙感分類模型做地物提取是很正常的,因?yàn)槟莻€(gè)時(shí)候深度學(xué)習(xí)才開始真正走進(jìn)大眾視野。這篇文章寫了很多關(guān)于這段過往,推薦閱讀。 2012,改變?nèi)祟惷\(yùn)的180天
以“Transformer”網(wǎng)絡(luò)架構(gòu)為核心的大模型技術(shù)出現(xiàn)后,已經(jīng)有不少基于(或者疊加)Transformer結(jié)構(gòu)來優(yōu)化遙感影像的識(shí)別和提取。
去年Facebook公布的SAM模型,也有很多廠商基于SAM模型來做遙感圖像分割提取的嘗試。
還有現(xiàn)在大模型廠商和自動(dòng)駕駛廠商的推出的視覺語言模型,提高了自動(dòng)駕駛系統(tǒng)的感知能力和決策水平,可實(shí)時(shí)監(jiān)測(cè)并分析視頻畫面中的異常情況,并通過自然語言生成警報(bào)信息,應(yīng)用在視頻監(jiān)測(cè)場(chǎng)景很有應(yīng)用潛力。
還有3D生成、三維重建,由于不太了解,這里就不贅述。
對(duì)公司產(chǎn)品、公司組織:
國內(nèi)GIS軟件行業(yè),定制化、項(xiàng)目化比較多,導(dǎo)致人力成本大,利潤(rùn)率不高。AI 大模型寫代碼能力帶來人效的提升,也許未來項(xiàng)目制不是問題?
不難想象,隨著AI應(yīng)用的不斷深入到行業(yè),能力不斷強(qiáng)化,個(gè)體能效不斷提升,這將極大地降低人力成本,對(duì)于人力密集型和知識(shí)密集型服務(wù)業(yè)市場(chǎng)將是巨大沖擊,比如律師,會(huì)計(jì),編輯,程序員等行業(yè)。
有了AI加持,同樣的事情可能會(huì)使用很少的人就能搞定,進(jìn)而顯著降低了企業(yè)在開發(fā)軟件時(shí)所需的人力成本,提升企業(yè)的市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。這樣傳統(tǒng)的人力外包型業(yè)務(wù)將快速被服務(wù)型AI應(yīng)用所替代,外包化將更加流行。
地理信息系統(tǒng)及其他地理空間解決方案,對(duì)于分析和理解我們周圍的世界至關(guān)重要,但對(duì)許多人來說,使用和理解起來卻十分困難。
對(duì)于初學(xué)者或者只是想利用GIS軟件簡(jiǎn)單做一些成果的用戶來說,GIS軟件地理專業(yè)術(shù)語多,操作復(fù)雜,對(duì)于新手極其不友好,在易用性方面有很大的改進(jìn)空間。
總之,這波大模型浪潮下,GIS軟件的智能化和易用性還有很大提升空間。
