<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    paulwong

    2025年4月30日 #

    強(qiáng)化學(xué)習(xí)資源

    蘑菇書(shū)EasyRL
    李宏毅老師的《深度強(qiáng)化學(xué)習(xí)》是強(qiáng)化學(xué)習(xí)領(lǐng)域經(jīng)典的中文視頻之一。李老師幽默風(fēng)趣的上課風(fēng)格讓晦澀難懂的強(qiáng)化學(xué)習(xí)理論變得輕松易懂,他會(huì)通過(guò)很多有趣的例子來(lái)講解強(qiáng)化學(xué)習(xí)理論。比如老師經(jīng)常會(huì)用玩 Atari 游戲的例子來(lái)講解強(qiáng)化學(xué)習(xí)算法。此外,為了教程的完整性,我們整理了周博磊老師的《強(qiáng)化學(xué)習(xí)綱要》、李科澆老師的《世界冠軍帶你從零實(shí)踐強(qiáng)化學(xué)習(xí)》以及多個(gè)強(qiáng)化學(xué)習(xí)的經(jīng)典資料作為補(bǔ)充。對(duì)于想入門(mén)強(qiáng)化學(xué)習(xí)又想看中文講解的人來(lái)說(shuō)絕對(duì)是非常推薦的。

    本教程也稱(chēng)為“蘑菇書(shū)”,寓意是希望此書(shū)能夠?yàn)樽x者注入活力,讓讀者“吃”下這本蘑菇之后,能夠饒有興致地探索強(qiáng)化學(xué)習(xí),像馬里奧那樣愈加強(qiáng)大,繼而在人工智能領(lǐng)域覓得意外的收獲。
    https://github.com/datawhalechina/easy-rl?tab=readme-ov-file


    posted @ 2025-04-30 14:15 paulwong 閱讀(15) | 評(píng)論 (0)編輯 收藏

    2025年4月24日 #

    足球數(shù)據(jù)資源

    足球基礎(chǔ)數(shù)據(jù)
    https://www.nami.com/details/4nw10i0tela68lq#interface

    足球統(tǒng)計(jì)數(shù)據(jù)
    https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

    足球統(tǒng)計(jì)數(shù)據(jù)
    https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

    足球高階數(shù)據(jù)
    https://www.nami.com/details/g5wvvikteeixwzd#interface

    指數(shù)數(shù)據(jù)
    https://www.nami.com/details/o6w9kipt4yi78k3#interface

    足球資料庫(kù)數(shù)據(jù)
    https://www.nami.com/details/7j8gxi0to7inrql#interface

    Marz火星數(shù)據(jù)(體育)
    https://www.kancloud.cn/marz/marz-sport/3098904



    posted @ 2025-04-24 14:56 paulwong 閱讀(48) | 評(píng)論 (0)編輯 收藏

    2025年4月19日 #

    ai預(yù)測(cè)足球資源

    基于機(jī)器學(xué)習(xí)的2022世界杯預(yù)測(cè)實(shí)戰(zhàn)
    https://www.showmeai.tech/article-detail/400

    AI 競(jìng)彩賽事 預(yù)測(cè)工具
    https://www.mysports.ai/cn

    posted @ 2025-04-19 01:07 paulwong 閱讀(18) | 評(píng)論 (0)編輯 收藏

    2025年3月21日 #

    微調(diào)訓(xùn)練的數(shù)據(jù)集

    使用trl庫(kù)做微調(diào)時(shí), 對(duì)數(shù)據(jù)集的要求是:

    如果是多輪對(duì)話(huà)場(chǎng)景:
    jsonl 文件,且需符合以下要求:
    1.每行是一個(gè)獨(dú)立的 JSON 對(duì)象;
    2 每個(gè)對(duì)象須包含一個(gè)鍵名為 messages 的數(shù)組,數(shù)組不能為空;
    3.messages 中每個(gè)元素必須包含 role 和 content 兩個(gè)字段:
    4.role 只能是 system,user 或 assisiant;
    5.如果有 system 角色消息, 需在數(shù)組首位;
    6.第一條非 system 消息必須是 user 角色;
    7.user 和 assisiant 角色的消息應(yīng)當(dāng)交替、成對(duì)出現(xiàn),不少于1對(duì);

    如果是指令微調(diào)場(chǎng)景:
    jsonl 文件,且需符合以下要求:
    1.每行是一個(gè)獨(dú)立的 JSON 對(duì)象;
    2 每個(gè)對(duì)象須包含且只能包含一個(gè)鍵名為 text 的鍵值對(duì),值不能為空;

    posted @ 2025-03-21 21:52 paulwong 閱讀(62) | 評(píng)論 (0)編輯 收藏

    2025年3月18日 #

    大模型訓(xùn)練的幾個(gè)階段

    大模型開(kāi)發(fā)出來(lái)后, 一般要經(jīng)過(guò)以下幾個(gè)階段的訓(xùn)練:

    預(yù)訓(xùn)練(Pre-Trained)

    單純提供文本: {"text":"..."}
    訓(xùn)練模型由第一個(gè)文字開(kāi)始, 預(yù)測(cè)后面的文字, 直到結(jié)束.
    這種模型只會(huì)做完成文本的任務(wù)

    監(jiān)督微調(diào)(Supervised Fine Turning)

    為了使模型能完成根據(jù)指令完成回答, 而不是隨機(jī)生成回答
    提供的文本: {"instruction":"...", "output":"..."}

    高效參數(shù)微調(diào)(Parameter Efficient Fine Turning)

    只調(diào)整部分參數(shù), 具體實(shí)現(xiàn)方法有LoRA

    參考:
    https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



    posted @ 2025-03-18 13:14 paulwong 閱讀(63) | 評(píng)論 (0)編輯 收藏

    2025年3月16日 #

    python資源

    python
    https://www.w3schools.com/python/

    https://www.runoob.com/python/python-basic-syntax.html


    posted @ 2025-03-16 20:54 paulwong 閱讀(32) | 評(píng)論 (0)編輯 收藏

    2025年3月12日 #

    大模型微調(diào)后的評(píng)估指標(biāo)

    大模型微調(diào)后的評(píng)估指標(biāo)是衡量模型性能的關(guān)鍵,通常根據(jù)任務(wù)類(lèi)型和具體需求選擇不同的評(píng)估指標(biāo)。以下是一些常見(jiàn)的評(píng)估指標(biāo)及其適用場(chǎng)景:


    1. 分類(lèi)任務(wù)

    • 準(zhǔn)確率(Accuracy):預(yù)測(cè)正確的樣本占總樣本的比例。
      • 適用場(chǎng)景:類(lèi)別分布均衡的任務(wù)。
    • 精確率(Precision):預(yù)測(cè)為正類(lèi)的樣本中,實(shí)際為正類(lèi)的比例。
      • 適用場(chǎng)景:關(guān)注減少假陽(yáng)性(False Positive)的任務(wù)。
    • 召回率(Recall):實(shí)際為正類(lèi)的樣本中,預(yù)測(cè)為正類(lèi)的比例。
      • 適用場(chǎng)景:關(guān)注減少假陰性(False Negative)的任務(wù)。
    • F1分?jǐn)?shù)(F1 Score):精確率和召回率的調(diào)和平均值。
      • 適用場(chǎng)景:類(lèi)別不平衡或需要平衡精確率和召回率的任務(wù)。
    • ROC-AUC:ROC曲線(xiàn)下的面積,衡量模型區(qū)分正負(fù)類(lèi)的能力。
      • 適用場(chǎng)景:二分類(lèi)任務(wù),尤其是類(lèi)別不平衡的情況。

    2. 回歸任務(wù)

    • 均方誤差(MSE, Mean Squared Error):預(yù)測(cè)值與真實(shí)值之差的平方的平均值。
      • 適用場(chǎng)景:對(duì)誤差較大的樣本懲罰更重的任務(wù)。
    • 均方根誤差(RMSE, Root Mean Squared Error):MSE的平方根。
      • 適用場(chǎng)景:與MSE類(lèi)似,但更接近原始數(shù)據(jù)尺度。
    • 平均絕對(duì)誤差(MAE, Mean Absolute Error):預(yù)測(cè)值與真實(shí)值之差的絕對(duì)值的平均值。
      • 適用場(chǎng)景:對(duì)異常值不敏感的任務(wù)。
    • R²(決定系數(shù)):模型解釋目標(biāo)變量方差的比例。
      • 適用場(chǎng)景:評(píng)估模型擬合優(yōu)度。

    3. 生成任務(wù)

    • BLEU(Bilingual Evaluation Understudy):衡量生成文本與參考文本的n-gram重疊程度。
      • 適用場(chǎng)景:機(jī)器翻譯、文本生成任務(wù)。
    • ROUGE(Recall-Oriented Understudy for Gisting Evaluation):衡量生成文本與參考文本的重疊程度,側(cè)重于召回率。
      • 適用場(chǎng)景:文本摘要、生成任務(wù)。
    • METEOR:綜合考慮精確率、召回率和詞序的評(píng)估指標(biāo)。
      • 適用場(chǎng)景:機(jī)器翻譯、文本生成任務(wù)。
    • Perplexity(困惑度):衡量模型預(yù)測(cè)概率分布的不確定性。
      • 適用場(chǎng)景:語(yǔ)言模型評(píng)估。

    4. 多標(biāo)簽任務(wù)

    • Hamming Loss:預(yù)測(cè)錯(cuò)誤的標(biāo)簽比例。
      • 適用場(chǎng)景:多標(biāo)簽分類(lèi)任務(wù)。
    • Jaccard Similarity:預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽的交集與并集之比。
      • 適用場(chǎng)景:多標(biāo)簽分類(lèi)任務(wù)。

    5. 排序任務(wù)

    • NDCG(Normalized Discounted Cumulative Gain):衡量排序結(jié)果的相關(guān)性。
      • 適用場(chǎng)景:推薦系統(tǒng)、信息檢索。
    • MAP(Mean Average Precision):平均精確率的均值。
      • 適用場(chǎng)景:信息檢索、推薦系統(tǒng)。

    6. 其他指標(biāo)

    • 訓(xùn)練時(shí)間:模型微調(diào)所需的時(shí)間。
    • 推理速度:模型生成結(jié)果的速度。
    • 資源消耗:模型運(yùn)行所需的計(jì)算資源(如GPU內(nèi)存、CPU使用率)。
    • 魯棒性:模型對(duì)噪聲、異常值或?qū)箻颖镜牡挚鼓芰Α?/li>

    7. 領(lǐng)域特定指標(biāo)

    • 醫(yī)學(xué)領(lǐng)域:敏感性(Sensitivity)、特異性(Specificity)、AUC-ROC。
    • 金融領(lǐng)域:收益曲線(xiàn)、夏普比率(Sharpe Ratio)。
    • 計(jì)算機(jī)視覺(jué):mAP(mean Average Precision)、IoU(Intersection over Union)。

    8. 人類(lèi)評(píng)估

    • 人工評(píng)分:通過(guò)人工評(píng)估生成結(jié)果的質(zhì)量(如流暢性、相關(guān)性、準(zhǔn)確性)。
    • 用戶(hù)滿(mǎn)意度:通過(guò)用戶(hù)反饋評(píng)估模型的實(shí)際效果。

    9. 模型對(duì)比

    • 基線(xiàn)對(duì)比:與未微調(diào)的模型或基線(xiàn)模型進(jìn)行性能對(duì)比。
    • 消融實(shí)驗(yàn):評(píng)估微調(diào)過(guò)程中不同組件(如數(shù)據(jù)、超參數(shù))對(duì)性能的影響。

    10. 綜合評(píng)估

    • 多指標(biāo)綜合:根據(jù)任務(wù)需求,結(jié)合多個(gè)指標(biāo)進(jìn)行綜合評(píng)估。
    • 任務(wù)特定指標(biāo):針對(duì)特定任務(wù)設(shè)計(jì)自定義指標(biāo)。

    在實(shí)際應(yīng)用中,選擇合適的評(píng)估指標(biāo)需要結(jié)合任務(wù)目標(biāo)、數(shù)據(jù)特點(diǎn)和業(yè)務(wù)需求,同時(shí)注意避免單一指標(biāo)的局限性。

    posted @ 2025-03-12 10:08 paulwong 閱讀(198) | 評(píng)論 (0)編輯 收藏

    2025年3月10日 #

    LLM全??蚣芡暾诸?lèi)清單(預(yù)訓(xùn)練+微調(diào)+工具鏈)

    https://blog.csdn.net/ViniJack/article/details/145789900



    posted @ 2025-03-10 11:29 paulwong 閱讀(47) | 評(píng)論 (0)編輯 收藏

    2025年3月8日 #

    醫(yī)療問(wèn)診系統(tǒng)資源

    計(jì)算機(jī)畢業(yè)設(shè)計(jì)Python+Neo4j知識(shí)圖譜醫(yī)療問(wèn)答系統(tǒng) 大模型
    https://baijiahao.baidu.com/s?id=1815574648931972744&wfr=spider&for=pc

    QABasedOnMedicaKnowledgeGraph
    https://github.com/liuhuanyong/QASystemOnMedicalKG/blob/master/README.md

    非結(jié)構(gòu)文字抽取實(shí)體與關(guān)系的大模型
    底座, 百川 https://huggingface.co/baichuan-inc/Baichuan2-13B-Chat/tree/main
    底座, llama2 https://huggingface.co/unsloth/llama-2-13b
    微調(diào)->百川 https://huggingface.co/zjunlp/baichuan2-13b-iepile-lora
    微調(diào)->llama2 https://huggingface.co/zjunlp/llama2-13b-iepile-lora

    SiameseUniNLU通用自然語(yǔ)言理解模型
    https://www.modelscope.cn/models/iic/nlp_structbert_siamese-uninlu_chinese-base/summary

    數(shù)據(jù)集
    https://huggingface.co/datasets/zjunlp/iepile

    各種已經(jīng)訓(xùn)練好的模型
    https://www.modelscope.cn/models?name=zpeng1989&page=1











    posted @ 2025-03-08 20:52 paulwong 閱讀(46) | 評(píng)論 (0)編輯 收藏

    使用nlp提取非結(jié)構(gòu)化數(shù)據(jù)中的信息

    @import url(http://m.tkk7.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); @import url(http://m.tkk7.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); 如果要從結(jié)構(gòu)化的數(shù)據(jù)中提取信息,用sql即可, 即要提取的信息在select 的字段中.

    如果要從非結(jié)構(gòu)化的數(shù)據(jù)中, 如純文本, 則要靠nlp, 要對(duì)文本理解后, 才能提取相應(yīng)的信息.

    https://www.w3cschool.cn/article/99991254.html

    文本結(jié)構(gòu)化 with SpaCy 攻略
    https://zhuanlan.zhihu.com/p/556163162
    https://zhuanlan.zhihu.com/p/557953165
    https://zhuanlan.zhihu.com/p/563334531
    https://zhuanlan.zhihu.com/p/573743734

    使用openspg自動(dòng)構(gòu)建醫(yī)療知識(shí)圖譜
    https://blog.csdn.net/myboyliu2007/article/details/139654943

    posted @ 2025-03-08 11:45 paulwong 閱讀(23) | 評(píng)論 (0)編輯 收藏

    僅列出標(biāo)題  下一頁(yè)
    主站蜘蛛池模板: 亚洲AV无码XXX麻豆艾秋| 亚洲第一二三四区| 午夜肉伦伦影院久久精品免费看国产一区二区三区 | 久久久久亚洲AV成人网| 美女免费视频一区二区| 四虎永久在线精品免费观看地址| 亚洲人成网亚洲欧洲无码| 性色av免费观看| 国产午夜无码精品免费看| 青青草原亚洲视频| 花蝴蝶免费视频在线观看高清版| 亚洲综合精品香蕉久久网| 国产亚洲免费的视频看| 久久久久久久亚洲Av无码 | 亚洲色少妇熟女11p| 免费无码又爽又高潮视频| 亚洲AV成人无码网站| 亚洲av区一区二区三| 久久国产精品免费一区| 亚洲AV无码久久精品狠狠爱浪潮| 久久久久久影院久久久久免费精品国产小说 | 免费萌白酱国产一区二区三区| 亚洲av无码无在线观看红杏| 久久国产乱子免费精品| 亚洲同性男gay网站在线观看| 最近2019中文字幕免费看最新 | 久久黄色免费网站| 亚洲最大黄色网址| 日本免费一区尤物| a一级爱做片免费| 亚洲福利在线观看| 成人免费视频一区二区三区| 国产成人亚洲精品播放器下载| 国产综合精品久久亚洲| 国产精品成人观看视频免费| 亚洲狠狠婷婷综合久久蜜芽| 亚洲综合无码AV一区二区| 3344永久在线观看视频免费首页 | 国产精品免费视频播放器| 羞羞视频免费网站在线看| 久久亚洲AV成人无码|