自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<dfn id="efvsw"><center id="efvsw"></center></dfn>

<big id="efvsw"></big>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

基于 LlamaFactory 微調(diào)大模型的實體識別的評估實現(xiàn)

AI悠閑區(qū)

發(fā)布于 2025-1-17 11:51

瀏覽

0收藏

介紹

使用 LlamaFactory 結(jié)合開源大語言模型實現(xiàn)文本分類：從數(shù)據(jù)集構(gòu)建到 LoRA 微調(diào)與推理評估.https://blog.csdn.net/sjxgghg/article/details/144290200

在前一篇文章的文本分類評估中，已經(jīng)介紹了主要的框架，故在大模型微調(diào)的流程框架方面本文不再贅述。

實體數(shù)據(jù)集格式

下述是實體識別評估的一條數(shù)據(jù)示例：

{
    "prompt": "從以下政府文本中，提取指定的實體類別，并按照JSON格式輸出結(jié)果。  xxx",      
    "predict": "\n```json\n{\n  \"行政區(qū)劃和地理實體\": [],\n  \"政府機構(gòu)和組織\": [],\n ... \"特定術(shù)語和關(guān)鍵詞\": [\"改革創(chuàng)新\", \"體制機制障礙\", \"行政管理體制\", \"城鄉(xiāng)一體化發(fā)展機制\"]\n}\n```", 
    "label": "```json\n{\n  \"行政區(qū)劃和地理實體\": [],\n  \"政府機構(gòu)和組織\": [], ... \"特定術(shù)語和關(guān)鍵詞\": [\"改革創(chuàng)新發(fā)展\", \"高質(zhì)量發(fā)展\", \"高品質(zhì)生活\", \"體制機制障礙\"]\n}\n```"
    ...
}

讓大模型按照json格式輸出。字典的鍵是實體的類別名，字典的值是一個列表其中包含所有該類別的所有預測結(jié)果。

實體識別評估代碼

import os
import re
import json
from dataclasses import dataclass

@dataclass
class EvalNode:
    # 默認值
    predict_right_num: int = 0
    predict_num: int = 0
    label_num: int = 0

    @property
    def accuracy(self):
        return self.predict_right_num / (self.predict_num + 1e-6)

    @property
    def recall(self):
        return self.predict_right_num / (self.label_num + 1e-6)

    @property
    def f1(self):
        return 2 * self.accuracy * self.recall / (self.accuracy + self.recall + 1e-6)

@dataclass
class NEREvaluate:
    ent_class: list[str]
    input_file: str
    avg_accuracy: int = 0
    avg_recall: int = 0
    avg_f1: int = 0
    predict_error: int = 0

    def __post_init__(self):
        self._evaluate_by_jsonl()

    def _evaluate_by_jsonl(self):

        with open(self.input_file, "r", encoding="utf-8") as f:
            self.total_ent = {ent: EvalNode() for ent in self.ent_class}

            for line in f:
                data = json.loads(line)

                # 大模型采取的是序列到序列到文本生成，不能轉(zhuǎn)換為字典的數(shù)據(jù)跳過即可
                try:
                    matches = re.search("\{.*?\}", data["predict"], re.DOTALL)
                    if matches:
                        predict = eval(matches.group(0))
                except:
                    self.predict_error += 1
                    predict = {ent: [] for ent in self.ent_class}

                try:
                    # 防止label出錯
                    matches = re.search("\{.*?\}", data["label"], re.DOTALL)
                    if matches:
                        labels = eval(matches.group(0))
                except:
                    continue

                # 每個不同的實體類別單獨計數(shù)
                for ent_name in self.ent_class:
                    label_set = set(labels.get(ent_name, []))
                    predict_set = set(predict.get(ent_name, []))
                    self.total_ent[ent_name].predict_right_num += len(
                        label_set & predict_set
                    )
                    self.total_ent[ent_name].predict_num += len(predict_set)
                    self.total_ent[ent_name].label_num += len(label_set)

        for ent in self.ent_class:
            self.avg_accuracy += self.total_ent[ent].accuracy
            self.avg_recall += self.total_ent[ent].recall
            self.avg_f1 += self.total_ent[ent].f1

        self.avg_accuracy = self.avg_accuracy / len(self.ent_class)
        self.avg_recall = self.avg_recall / len(self.ent_class)
        self.avg_f1 = self.avg_f1 / len(self.ent_class)

下述是實體的類別：

ENT_CLASS = [
    "行政區(qū)劃和地理實體",
    "政府機構(gòu)和組織",
    "法律法規(guī)與政策",
    "人物與職務",
    "產(chǎn)業(yè)",
    "產(chǎn)業(yè)園區(qū)",
    "高新技術(shù)",
    "項目與工程",
    "社會服務與基礎設施",
    "特定術(shù)語和關(guān)鍵詞",
]

ner_eval = NEREvaluate(
        ENT_CLASS, "xxx/generated_predictions.jsonl")
    )

for key, item in ner_eval.total_ent.items():
    print(key, item.f1)

輸出評估結(jié)果：

行政區(qū)劃和地理實體 0.6292412411907403
人物與職務 0.45714235316380664
...
特定術(shù)語和關(guān)鍵詞 0.29256472295174

accuracy 、recall 與 f1 均進行了計算，大家參考代碼自行查看與輸出即可。

在評估大模型生成的實體時，只有大模型把實體的邊界完全預測正確，才認為預測對。

本文轉(zhuǎn)載自 ??AI悠閑區(qū)??，作者： jieshenai

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

今日arXiv最熱NLP大模型論文：Github萬星！北航發(fā)布零代碼大模型微調(diào)平臺LlamaFactory

pangguiyu ? 4310瀏覽 ? 0回復
當下最容易上手的大模型微調(diào)工具是誰？LLamaFactory或是其中之一

Syrupup ? 1.3w瀏覽 ? 0回復
從零實現(xiàn)大模型-GPT2指令微調(diào)

魚蟲子 ? 3741瀏覽 ? 0回復
從零實現(xiàn)大模型-BERT微調(diào)

魚蟲子 ? 2919瀏覽 ? 0回復
MLLM QLoRA微調(diào)實戰(zhàn)：基于最新的袖珍Mini-InternVL模型

51CTO內(nèi)容精選 ? 3094瀏覽 ? 0回復
從零實現(xiàn)大模型-GPT2任務微調(diào)

魚蟲子 ? 3268瀏覽 ? 0回復
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時代 ? 6322瀏覽 ? 0回復
如何評估大語言模型生成結(jié)果的多樣性

sbf_2000 ? 3113瀏覽 ? 1回復
基于 Kimi 一鍵整理實體及其關(guān)系，并制作知識圖譜

wsp_ping ? 4115瀏覽 ? 0回復
高效打造知識圖譜，使用LlamaIndex Relik實現(xiàn)實體關(guān)聯(lián)和關(guān)系抽取

小虎哦哦 ? 3777瀏覽 ? 0回復
大模型ReAct框架——打造AI Agent的代碼實現(xiàn)——基于LLM + Function Call構(gòu)建Agent

AI探索時代 ? 5916瀏覽 ? 0回復
大模型微調(diào)終極指南

NLP工作站 ? 3595瀏覽 ? 0回復
超越文本，GPT-4在虹膜生物識別的創(chuàng)新應用

Aceryt ? 2161瀏覽 ? 0回復
搭建大模型知識庫流程，以及基于Langchain實現(xiàn)大模型知識庫案例

AI探索時代 ? 3411瀏覽 ? 0回復
自然（Nature）科學數(shù)據(jù)子刊：用于對話情境中情緒識別的 EEG-音頻-視頻數(shù)據(jù)集的創(chuàng)新應用

xuxiangda ? 5356瀏覽 ? 0回復
微調(diào)谷歌開源Gemini Flash模型實現(xiàn)PII脫敏實戰(zhàn)

51CTO內(nèi)容精選 ? 2698瀏覽 ? 0回復
使用 LlamaFactory 結(jié)合開源大語言模型實現(xiàn)文本分類：從數(shù)據(jù)集構(gòu)建到 LoRA 微調(diào)與推理評估

AI悠閑區(qū) ? 5710瀏覽 ? 0回復
FineMedLM-o1: 基于監(jiān)督微調(diào)與測試時訓練的醫(yī)學推理增強型大語言模型

頓數(shù)AI ? 2783瀏覽 ? 0回復
GoRA: 基于梯度驅(qū)動的自適應低秩微調(diào)方法

頓數(shù)AI ? 2049瀏覽 ? 0回復

AI悠閑區(qū)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

MDQA 知識圖譜提示用于多文檔問答 8天前發(fā)布
提示詞繞過大模型安全限制 2025-04-25 06:23:19發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復

上一篇： LLaMA-Factory 微調(diào)與部署詳細流程：從入門到實踐

下一篇：三種文本相似計算方法：規(guī)則、向量與大模型裁判

社區(qū)精華內(nèi)容

目錄