机械学习自然言语処理ー.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《机械学习自然言语処理ー.pptx》由会员分享,可在线阅读,更多相关《机械学习自然言语処理ー.pptx(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、機械学習自然言語処理PerceptronCRF岡野原大輔東京大学PreferredInfrastructure20238/3PFI本郷目次自然言語処理紹介機械学習導入学習(最大法)過学習/正則化多分類系列分類(CRF,StructuredPerceptron)眠自然言語処理(1/2)言語情報処理言語研究対比自然言語世界最初出現頃自動翻訳試。中歴史長分野近年的成功,Google非常幅広分野接触、境地領域処理手法=言語学,数学,統計学,機械学習,構造,物理処理対象=情報検索,音声情報,言語絡何自然言語処理(2/2)分野例構文解析(係受解析)意味解析,SRL機械翻訳(統計的機械翻訳,)情報検索固有表
2、現抽出、文書分類、単語、有名学会、ComputationalLinguistic,ACL,EMNLP,CoLing,NAACL,EACL,IJCNLP,自然言語処理学会:/hillbig.cocolog-nifty/do/2023/04/post_fe44.htmlACLanthology自然言語処理機械学習使自然言語処理編人手書処理例:排除if(s=/H|奥様|楽/)then単純強力手法昔現在活躍現時点日英機械翻訳方精度良自然言語処理編長所内部処理分人手調整可能頑張頑張精度上短所:大(最初精度伸、伸、)、新弱、専門知識必要(職人芸)、一貫性無(時間、人変)自然言語処理機械学習編人手書代正解訓
3、練用意、正解導導出自然言語処理場合、単語品詞出現利用候補集合決,中効学習自動探作機械学習前vs機械学習何問題解場合、機械学習使検討訓練得対書方良場合多問題、要求精度、問題対知識吟味多素性形機械学習反映、複雑場合人(文法変換数千行perl)表現多自然言語情報疎高次元扱文書BOW表現、V単語種類数時,各単語0V-1順番番号振i番目単語出現Vi=1V次元扱0:Best1:Drug2:Congratuation3:FlowerDrug Best FlowerDrugCongratuation11010110各値決使素性(、特徴)、高次元素性(特徴)呼。線形識別器分類問題:入力x値(y=+1,-1)分類
4、例:文書(+1)or以外(-1)分類S(x)0y=+1S(x)0、xi出現度合増(|wi|大大効)w求重w求訓練(xi,yi)(yi=1or-1)正分類w求全iyiwTxi0訓練分類、未知分類(期待。真面目汎化性能議論)学習学習学習訓練1例見w更新長所:全部訓練例良。速(一般訓練数線形計算量)短所:比適当、訓練例順番偏大場合精度不安定学習訓練全部見w求長所:精度良、理論的保証強(汎化性能)短所:重場合多学習Rosenblatt57w=0,0,.0初期化loop(xi,yi)訓練s:=yiwTxi/wTxi=現在予測if(s0)/現在予測外w:=w+yixi/w+yixi,01場合endifen
5、d学習更新後重w:=w+yixi使、一度間違訓練例(xi,yi)分類wTxi=(w+yixi)Txi=wTxi+yixiTxi先程間違予測結果常正w正解出更新Perceptron収束定理Block62Novikoff62Q.直前訓練例分類更新、全訓練例分類?A.訓練例線形分離可能定理:訓練(xi,yi)(i=1.m)(|xi|wget :/oll.googlecode /files/oll-0.01.tar.gzcd oll-0.01;./configure;make;(make install)oll_train P trainfile modelfile(学習、学習結果modelfile保
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机械 学习 自然 言语
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内