<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    paulwong

    2025年3月8日 #

    強化學習資源

    蘑菇書EasyRL
    李宏毅老師的《深度強化學習》是強化學習領域經典的中文視頻之一。李老師幽默風趣的上課風格讓晦澀難懂的強化學習理論變得輕松易懂,他會通過很多有趣的例子來講解強化學習理論。比如老師經常會用玩 Atari 游戲的例子來講解強化學習算法。此外,為了教程的完整性,我們整理了周博磊老師的《強化學習綱要》、李科澆老師的《世界冠軍帶你從零實踐強化學習》以及多個強化學習的經典資料作為補充。對于想入門強化學習又想看中文講解的人來說絕對是非常推薦的。

    本教程也稱為“蘑菇書”,寓意是希望此書能夠為讀者注入活力,讓讀者“吃”下這本蘑菇之后,能夠饒有興致地探索強化學習,像馬里奧那樣愈加強大,繼而在人工智能領域覓得意外的收獲。
    https://github.com/datawhalechina/easy-rl?tab=readme-ov-file


    posted @ 2025-04-30 14:15 paulwong 閱讀(15) | 評論 (0)編輯 收藏

    足球數據資源

    足球基礎數據
    https://www.nami.com/details/4nw10i0tela68lq#interface

    足球統計數據
    https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

    足球統計數據
    https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

    足球高階數據
    https://www.nami.com/details/g5wvvikteeixwzd#interface

    指數數據
    https://www.nami.com/details/o6w9kipt4yi78k3#interface

    足球資料庫數據
    https://www.nami.com/details/7j8gxi0to7inrql#interface

    Marz火星數據(體育)
    https://www.kancloud.cn/marz/marz-sport/3098904



    posted @ 2025-04-24 14:56 paulwong 閱讀(48) | 評論 (0)編輯 收藏

    ai預測足球資源

    基于機器學習的2022世界杯預測實戰
    https://www.showmeai.tech/article-detail/400

    AI 競彩賽事 預測工具
    https://www.mysports.ai/cn

    posted @ 2025-04-19 01:07 paulwong 閱讀(19) | 評論 (0)編輯 收藏

    微調訓練的數據集

    使用trl庫做微調時, 對數據集的要求是:

    如果是多輪對話場景:
    jsonl 文件,且需符合以下要求:
    1.每行是一個獨立的 JSON 對象;
    2 每個對象須包含一個鍵名為 messages 的數組,數組不能為空;
    3.messages 中每個元素必須包含 role 和 content 兩個字段:
    4.role 只能是 system,user 或 assisiant;
    5.如果有 system 角色消息, 需在數組首位;
    6.第一條非 system 消息必須是 user 角色;
    7.user 和 assisiant 角色的消息應當交替、成對出現,不少于1對;

    如果是指令微調場景:
    jsonl 文件,且需符合以下要求:
    1.每行是一個獨立的 JSON 對象;
    2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對,值不能為空;

    posted @ 2025-03-21 21:52 paulwong 閱讀(63) | 評論 (0)編輯 收藏

    大模型訓練的幾個階段

    大模型開發出來后, 一般要經過以下幾個階段的訓練:

    預訓練(Pre-Trained)

    單純提供文本: {"text":"..."}
    訓練模型由第一個文字開始, 預測后面的文字, 直到結束.
    這種模型只會做完成文本的任務

    監督微調(Supervised Fine Turning)

    為了使模型能完成根據指令完成回答, 而不是隨機生成回答
    提供的文本: {"instruction":"...", "output":"..."}

    高效參數微調(Parameter Efficient Fine Turning)

    只調整部分參數, 具體實現方法有LoRA

    參考:
    https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



    posted @ 2025-03-18 13:14 paulwong 閱讀(64) | 評論 (0)編輯 收藏

    python資源

    python
    https://www.w3schools.com/python/

    https://www.runoob.com/python/python-basic-syntax.html


    posted @ 2025-03-16 20:54 paulwong 閱讀(33) | 評論 (0)編輯 收藏

    大模型微調后的評估指標

    大模型微調后的評估指標是衡量模型性能的關鍵,通常根據任務類型和具體需求選擇不同的評估指標。以下是一些常見的評估指標及其適用場景:


    1. 分類任務

    • 準確率(Accuracy):預測正確的樣本占總樣本的比例。
      • 適用場景:類別分布均衡的任務。
    • 精確率(Precision):預測為正類的樣本中,實際為正類的比例。
      • 適用場景:關注減少假陽性(False Positive)的任務。
    • 召回率(Recall):實際為正類的樣本中,預測為正類的比例。
      • 適用場景:關注減少假陰性(False Negative)的任務。
    • F1分數(F1 Score):精確率和召回率的調和平均值。
      • 適用場景:類別不平衡或需要平衡精確率和召回率的任務。
    • ROC-AUC:ROC曲線下的面積,衡量模型區分正負類的能力。
      • 適用場景:二分類任務,尤其是類別不平衡的情況。

    2. 回歸任務

    • 均方誤差(MSE, Mean Squared Error):預測值與真實值之差的平方的平均值。
      • 適用場景:對誤差較大的樣本懲罰更重的任務。
    • 均方根誤差(RMSE, Root Mean Squared Error):MSE的平方根。
      • 適用場景:與MSE類似,但更接近原始數據尺度。
    • 平均絕對誤差(MAE, Mean Absolute Error):預測值與真實值之差的絕對值的平均值。
      • 適用場景:對異常值不敏感的任務。
    • R²(決定系數):模型解釋目標變量方差的比例。
      • 適用場景:評估模型擬合優度。

    3. 生成任務

    • BLEU(Bilingual Evaluation Understudy):衡量生成文本與參考文本的n-gram重疊程度。
      • 適用場景:機器翻譯、文本生成任務。
    • ROUGE(Recall-Oriented Understudy for Gisting Evaluation):衡量生成文本與參考文本的重疊程度,側重于召回率。
      • 適用場景:文本摘要、生成任務。
    • METEOR:綜合考慮精確率、召回率和詞序的評估指標。
      • 適用場景:機器翻譯、文本生成任務。
    • Perplexity(困惑度):衡量模型預測概率分布的不確定性。
      • 適用場景:語言模型評估。

    4. 多標簽任務

    • Hamming Loss:預測錯誤的標簽比例。
      • 適用場景:多標簽分類任務。
    • Jaccard Similarity:預測標簽與真實標簽的交集與并集之比。
      • 適用場景:多標簽分類任務。

    5. 排序任務

    • NDCG(Normalized Discounted Cumulative Gain):衡量排序結果的相關性。
      • 適用場景:推薦系統、信息檢索。
    • MAP(Mean Average Precision):平均精確率的均值。
      • 適用場景:信息檢索、推薦系統。

    6. 其他指標

    • 訓練時間:模型微調所需的時間。
    • 推理速度:模型生成結果的速度。
    • 資源消耗:模型運行所需的計算資源(如GPU內存、CPU使用率)。
    • 魯棒性:模型對噪聲、異常值或對抗樣本的抵抗能力。

    7. 領域特定指標

    • 醫學領域:敏感性(Sensitivity)、特異性(Specificity)、AUC-ROC。
    • 金融領域:收益曲線、夏普比率(Sharpe Ratio)。
    • 計算機視覺:mAP(mean Average Precision)、IoU(Intersection over Union)。

    8. 人類評估

    • 人工評分:通過人工評估生成結果的質量(如流暢性、相關性、準確性)。
    • 用戶滿意度:通過用戶反饋評估模型的實際效果。

    9. 模型對比

    • 基線對比:與未微調的模型或基線模型進行性能對比。
    • 消融實驗:評估微調過程中不同組件(如數據、超參數)對性能的影響。

    10. 綜合評估

    • 多指標綜合:根據任務需求,結合多個指標進行綜合評估。
    • 任務特定指標:針對特定任務設計自定義指標。

    在實際應用中,選擇合適的評估指標需要結合任務目標、數據特點和業務需求,同時注意避免單一指標的局限性。

    posted @ 2025-03-12 10:08 paulwong 閱讀(198) | 評論 (0)編輯 收藏

    LLM全棧框架完整分類清單(預訓練+微調+工具鏈)

    https://blog.csdn.net/ViniJack/article/details/145789900



    posted @ 2025-03-10 11:29 paulwong 閱讀(48) | 評論 (0)編輯 收藏

    醫療問診系統資源

    計算機畢業設計Python+Neo4j知識圖譜醫療問答系統 大模型
    https://baijiahao.baidu.com/s?id=1815574648931972744&wfr=spider&for=pc

    QABasedOnMedicaKnowledgeGraph
    https://github.com/liuhuanyong/QASystemOnMedicalKG/blob/master/README.md

    非結構文字抽取實體與關系的大模型
    底座, 百川 https://huggingface.co/baichuan-inc/Baichuan2-13B-Chat/tree/main
    底座, llama2 https://huggingface.co/unsloth/llama-2-13b
    微調->百川 https://huggingface.co/zjunlp/baichuan2-13b-iepile-lora
    微調->llama2 https://huggingface.co/zjunlp/llama2-13b-iepile-lora

    SiameseUniNLU通用自然語言理解模型
    https://www.modelscope.cn/models/iic/nlp_structbert_siamese-uninlu_chinese-base/summary

    數據集
    https://huggingface.co/datasets/zjunlp/iepile

    各種已經訓練好的模型
    https://www.modelscope.cn/models?name=zpeng1989&page=1











    posted @ 2025-03-08 20:52 paulwong 閱讀(47) | 評論 (0)編輯 收藏

    使用nlp提取非結構化數據中的信息

    @import url(http://m.tkk7.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); @import url(http://m.tkk7.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); 如果要從結構化的數據中提取信息,用sql即可, 即要提取的信息在select 的字段中.

    如果要從非結構化的數據中, 如純文本, 則要靠nlp, 要對文本理解后, 才能提取相應的信息.

    https://www.w3cschool.cn/article/99991254.html

    文本結構化 with SpaCy 攻略
    https://zhuanlan.zhihu.com/p/556163162
    https://zhuanlan.zhihu.com/p/557953165
    https://zhuanlan.zhihu.com/p/563334531
    https://zhuanlan.zhihu.com/p/573743734

    使用openspg自動構建醫療知識圖譜
    https://blog.csdn.net/myboyliu2007/article/details/139654943

    posted @ 2025-03-08 11:45 paulwong 閱讀(24) | 評論 (0)編輯 收藏

    主站蜘蛛池模板: 久久久久久亚洲Av无码精品专口| 亚洲精品无码久久毛片| 亚洲福利一区二区精品秒拍| 久久国产精品国产自线拍免费| 久久精品国产亚洲一区二区| 久久久久久毛片免费看 | 成人在线免费观看| 亚洲色无码专区一区| 免费的涩涩视频在线播放| 国产精品亚洲综合| 精品亚洲视频在线观看| 两个人看的www免费高清 | mm1313亚洲精品无码又大又粗| 污网站在线观看免费| 精品国产人成亚洲区| 久操免费在线观看| 亚洲国产精品综合一区在线| 野花高清在线电影观看免费视频 | 亚洲自偷自偷图片| 免费视频成人手机在线观看网址| 亚洲欧洲国产精品你懂的| 免费观看的毛片大全| 亚洲AV无码专区在线厂| 久久久久久久亚洲精品| 无码国产精品一区二区免费模式| 亚洲精品无码久久久久久久| 免费国产黄线在线观看| 免费人成视频在线观看免费| 亚洲av无码无在线观看红杏| 国产成人无码免费看视频软件 | 日韩吃奶摸下AA片免费观看| 日韩色日韩视频亚洲网站| 亚洲精品少妇30p| 99在线视频免费观看视频 | 亚洲一级片在线播放| 免费吃奶摸下激烈视频| 国产日韩精品无码区免费专区国产 | 久久亚洲精品专区蓝色区| 免费在线看片网站| 国产成人免费ā片在线观看老同学 | 在线a亚洲老鸭窝天堂av高清|