back to index
[DLHLP 2020] Overview of NLP Tasks

link |
Natural Language指的就是
link |
而Natural Language它可以是文字的
link |
Natural Language Processing的一環
link |
一般我們在講Natural Language Processing的時候
link |
那很多人在講Natural Language Processing的時候
link |
到底Natural Language Processing的定義是什麼
link |
如果說Natural Language Processing的定義是
link |
那如果你說Natural Language Processing
link |
就叫Natural Language Processing的話
link |
所以這個Natural Language Processing
link |
他在研究Natural Language Processing的時候
link |
那每個人心理想像的Natural Language Processing
link |
那有人可能會說Natural Language Processing
link |
要有理解才叫做Natural Language Processing
link |
TTS裡面也會用到BERT的model啊
link |
所以TTS裡面也有用到understanding啊
link |
算作是Natural Language Processing的一環
link |
那你聽到有人在講NLP這個詞彙的時候
link |
好那因為Natural Language Processing的
link |
也可以指的是Subword的Unit
link |
然後最後一個Time Step的資訊讀出來
link |
那就通過幾個Transform就變成Class
link |
通過Transform就變成Class
link |
Sequence to Sequence的Model
link |
那Sequence to Sequence Model
link |
那有時候你還會需要做Attention
link |
那就是Sequence to Sequence Model
link |
需不需要加上Copy的Mechanism
link |
如果輸入的部分是一個Sequence
link |
如果輸入的是不只一個Sentence
link |
而是多個Sentence的話怎麼辦呢
link |
分別用一個Model去做Encode
link |
再丟給另外一個負責做整合的Network
link |
你可以分成只有一個Sequence當作輸入
link |
NLP的任務有的是要輸出一個Class
link |
有的是直接Copy輸入的資訊作為輸出
link |
有的是輸出一個General的Sequence
link |
這些NLP的任務分別是屬於哪一個類別
link |
那PoS的Tagging做的事情就是說
link |
丟到一個PoS Tagging的模型裡面
link |
PoS Tagging的模型告訴我們說
link |
這個句子不是sentence那個句子
link |
丟到一個PoS Tagging的模型
link |
先告訴我們PoS Tagging的資訊
link |
再把這個PoS Tagging的資訊
link |
再丟到其他的downstream的task
link |
但是如果你先做一下PoS Tagging
link |
那你就可以讓downstream的模型
link |
這個downstream task用的模型
link |
就已經有PoS Tagging的能力
link |
把一個句子先做PoS Tagging
link |
假設你downstream的模型夠強
link |
自動就有PoS Tagging的能力
link |
那像PoS Tagging這種問題啊
link |
是word segmentation
link |
做word segmentation這件事
link |
那word segmentation
link |
你完全就不需要word segmentation
link |
而且這個word segmentation
link |
有時候是會有這個ambiguity的
link |
那因為word segmentation
link |
它就做一個binary的classification
link |
在downstream的task裡面
link |
what segmentation在中文
link |
那這是what segmentation
link |
每一個token都要給它一個class
link |
知道這個詞彙的boundary在哪裡
link |
一個是Constituency的Parsing
link |
跟Dependency的Parsing
link |
那Burt有沒有學到Parsing呢
link |
叫做Coreference Resolution
link |
那Coreference Resolution呢
link |
那這個Coreference Resolution
link |
去念這個Layside School
link |
那紙袋消解Coreference Resolution
link |
跟Layer High School
link |
那Coreference Resolution
link |
先做Coreference Resolution以後
link |
Coreference Resolution拉出來
link |
講說如果用Deep Learning的技術
link |
Coreference Resolution
link |
Extractive Summarization
link |
Extractive Summarization
link |
做Extractive Summary
link |
也許做到Extractive Summarization
link |
那Extractive Summarization
link |
Binary Classification的問題
link |
丟到一個Binary的Classifier
link |
這Binary Classifier它要做的事情
link |
那訓練一個Binary的Classification
link |
Extractive Summarization的事情
link |
做Binary的Classification
link |
或今天你可能會選擇Transformer
link |
Extracted Summarization的任務
link |
都用Sentence Embedding
link |
把一堆Sentence Embedding
link |
決定說每一個Sentence Embedding
link |
隨著Sequence to Sequence
link |
怎麼做Attractive Summarization
link |
所以Attractive Summarization的意思就是說
link |
Sequence to Sequence Learning的問題
link |
Sequence to Sequence Model
link |
它是輸入一個Long的Sequence
link |
輸出一個Short的Sequence
link |
Sequence to Sequence Model
link |
Sequence to Sequence Model
link |
來解Attractive Summarization的問題
link |
讓你的Sequence to Sequence Model
link |
類似Pointer Network的架構
link |
是Attractive Summarization
link |
它是Sequence to Sequence Model
link |
Sequence to Sequence Model
link |
這個Machine Translation的時候
link |
輸入How are you的聲音訊號
link |
好那對Machine Translation來說
link |
就是Unsupervised Learning
link |
在做Machine Translation
link |
我們才能做Machine Translation的話
link |
不同Language Pair的Training Data
link |
所以在Machine Translation的領域
link |
Unsupervised Machine Translation
link |
這樣子的Unsupervised Learning
link |
那Machine Translation
link |
好了 還有Grammar Error Correction
link |
Grammar Error Correction是什麼呢
link |
這個Error Correction的Model
link |
在還沒有Deep Learning的時候
link |
Sequence to Sequence
link |
Sequence to Sequence
link |
那當然今天Input的Sequence
link |
Grammar Error Correction的問題
link |
Bold can have wrong race
link |
Bold could have wrong the race
link |
Sequence to Sequence Model
link |
來解Grammar Error Correction
link |
你可以用另外一個classifier
link |
把Grammar Error Correction
link |
input一個token sequence
link |
它是一個sequence-to-sequence
link |
比如說sentiment classification
link |
sentiment classification
link |
顯然就是input一個sequence
link |
那sentiment classification
link |
也許他可以用sentiment classification的技術
link |
那這個是Sentiment Classification
link |
Facebook或Twitter上的Po文
link |
就是Support、Deny、Query跟Comment
link |
那像這種Stance Detection的問題
link |
那像這樣Stance Detection的Model
link |
常常被用在Variety的Prediction裡面
link |
什麼是Variety的Prediction呢
link |
Variety的Prediction應該可以
link |
Variety Prediction的Model
link |
那像這種Variety Prediction的
link |
這種任務有辦法用Machine Learning做嗎
link |
是有辦法用Machine Learning做的
link |
如果用Machine Learning做
link |
就是Binary的Classification
link |
跟它的Stance Detection
link |
Prediction的Problem
link |
是Natural Language的Inference
link |
那Natural Language Inference
link |
在Natural Language Inference
link |
有沒有辦法推得這個Hypothesis
link |
Machine Learning的技術來解
link |
Google return的第一篇文章
link |
那stand alone的stand
link |
也可以做question answering
link |
在這種end-to-end的deep model
link |
machine learning的技術做的
link |
answer type的detection
link |
answer的candidate裡面呢
link |
他會做question的pre-processing
link |
他做question的pre-processing
link |
他這個question的pre-processing裡面
link |
做完question的pre-processing以後
link |
一樣可以根據pre-processing的結果
link |
然後再從candidate的answer裡面
link |
他的是正確的confidence有多大
link |
可能用machine learning的方法
link |
logistic regression
link |
machine learning的課的開頭
link |
認個logistic regression
link |
如果你想要做question answering
link |
所以他是input兩個sequence
link |
output一個sequence的問題
link |
好那這個knowledge的source
link |
他假設他是unstructured document
link |
他可以是從search engine來的
link |
就當作你的QA model的node source
link |
reading comprehension
link |
所以它是input好幾個sequence
link |
output一個sequence的問題
link |
今天在reading comprehension
link |
我們假設within the cloud這個答案
link |
output一個sequence的問題
link |
在講這個gravity correction的時候
link |
到第17個word就是gravity
link |
非常強的copy的mechanism
link |
I just say your name
link |
You don't need to know my name
link |
其實應該不是Sequence to Sequence
link |
他應該是IR Base的這個Chatbot
link |
Sequence to Sequence的Solution
link |
Sequence to Sequence的Model
link |
你就是一個Sequence to Sequence的Model
link |
Sequence to Sequence的Model
link |
可以操控ChatBar的Personality
link |
ChatBar的Personality
link |
Text Oriented的Dialogue
link |
那Text Oriented Dialogue
link |
Text Oriented Dialogue的例子
link |
text oriented dialogue的例子
link |
也就是一個sequence to sequence model
link |
text oriented dialogue
link |
那在text oriented dialogue裡面
link |
常見的把大的end to end的model
link |
叫做natural language generation
link |
text oriented dialogue
link |
也會想用deep learning的技術
link |
那什麼是state tracker呢
link |
今天我們做的是text oriented dialogue
link |
而state trigger要做的事情就是
link |
而那state trigger要做的事情
link |
也許policy也可以直接用learn
link |
那policy它就是輸入一個state
link |
可以用reinforcement learning的方法
link |
這policy就是跟reinforcement learning有關
link |
輸出是我們到底要採取哪一個action
link |
已經有不少文獻是硬學state tracker
link |
end-to-end硬training
link |
這個很多時候state tracker
link |
所以先做Natural Language Understanding
link |
把Natural Language Understanding的結果
link |
什麼是Natural Language Understanding呢
link |
一個是intent classification
link |
那intent classification
link |
那像這種intent classification
link |
那這個是intent classification
link |
那還有一個東西叫做slot filling
link |
在這個對這個text oriented dialog
link |
把這個slot filling的結果
link |
看看state tracker根據這些slot filling的結果
link |
那這個slot filling的問題
link |
其實跟我們前面講到的POS tagging
link |
它就是input一個sequence
link |
就是這個sequence裡面每一個token
link |
那在Machine Learning 9門課
link |
也是用slot filling來給大家作為例子
link |
那其實state tracker也沒有那麼複雜
link |
把所有slot filling的結果
link |
把所有slot filling的結果收集起來
link |
整個text oriented的dialog
link |
你當然可以end to end的run它
link |
那它就是input多個sequence
link |
output一個sequence的問題
link |
你有state tracker的模組
link |
而state tracker的模組裡面
link |
state tracker是真的可以end to end
link |
然後end to end的end train
link |
那什麼是knowledge graph呢
link |
在knowledge graph裡面呢
link |
然後knowledge graph裡面呢
link |
它的edge就是entity跟entity之間的關係
link |
這個就是knowledge graph上面的edge
link |
那knowledge graph相關的研究
link |
給你的model一個knowledge graph
link |
它怎麼把knowledge graph裡面的資訊
link |
也許你需要用到一些graph neural network的東西
link |
那如果你不知道什麼是graph neural network的話呢
link |
什麼是這個graph based model
link |
抽取出knowledge graph
link |
從你的這個大量的文件裡面抽出entity
link |
然後再從大量的文件裡面找出entity
link |
其實是一個非常非常simplified的講法啦
link |
這是一個非常非常simplified的講法
link |
過度簡化了knowledge graph
link |
產生knowledge graph這個問題
link |
怎麼產生knowledge graph這件事
link |
怎麼把node也就是entity抽出來
link |
Name Entity Recognition
link |
Name Entity Recognition
link |
就是要把一個句子裡面的Name Entity
link |
至於你關心什麼樣的Name Entity
link |
這並不是完整的Name Entity的定義
link |
這取決於你現在的application是什麼
link |
所以今天這個Name Entity的定義
link |
那Name Entity的Recognition
link |
PoS Tagging跟Slot Filling
link |
要給Sequence裡面的每一個Token
link |
這個Sequence裡面的每一個Token
link |
這個問題叫做Entity的Linking
link |
或者是Entity的Resolution
link |
這個叫做Entity的Linking
link |
知道說兩個Entity之間的Relation是什麼
link |
Relation Extraction的Model
link |
這Relation Extraction的Model
link |
Relation Extraction裡面去
link |
你的Relation Extraction的Model
link |
所有可能的Relation都窮取出來
link |
然後你的Relation Extraction
link |
那其實Relation Extraction
link |
兩個Entity它之間的Relation
link |
但是它從Machine Learning的角度來看
link |
就是你用做Relation Extraction
link |
你的Relation Extraction的Model
link |
Relation Extraction往往還會有一個class
link |
是Relation Extraction的部分
link |
那這樣聽起來好像不是非常的Intelligent
link |
它是General Language Understanding Evaluation的所行
link |
那GLUE呢 集合了很多主辦方覺得重要的
link |
第一個是Linguistic Acceptability
link |
第二個是Sentimental Classification
link |
接下來有這個Paraphrase的Corpus
link |
跟Quora的Question Pair
link |
跟Semantic Textual Similarity
link |
輸出就是這兩個句子的意思像或者是不像
link |
都是Natural Language Inference NLI相關的問題
link |
Machine在Groo上面的performance
link |
稍微超越人類的performance了
link |
但是從machine learning
link |
這個super glue剩下的四個任務
link |
這個是一個co-reference的問題
link |
不過把co-reference的問題再做簡化
link |
它現在是Salesforce在maintain
link |
decaphone它就是十項全能的比賽
link |
那到底機器理解人類的語言的能力到哪裡
link |
in general的整體而言了解人類的語言
link |
那像D卡NLP還有剛才講的group
link |
其實都是question answering的問題
link |
那麼到question answering
link |
都看成question answering的問題呢
link |
如果你要叫機器做sentiment classification
link |
這樣機器就可以做到sentiment classification
link |
所以Dcard NLP裡面雖然有十個任務
link |
sentiment classification
link |
detection, veracity prediction
link |
interclassification, dialogue policy
link |
輸入多個sequence輸出一個class的有
link |
NLI, search engine, relation extraction
link |
然後給sequence每個token都上個類別的
link |
有POS tagging, word segmentation
link |
extracted summarization, slot feeding, NEI
link |
然後要從input的sequence裡面呢
link |
extracted summarization, translation
link |
grammar correction, NLG
link |
輸入多個sequence輸出一個sequence的有
link |
general QA, check bar, state tracker
link |
test oriented dialogue