THE CURIOUS CASE OF NEURAL TEXT DeGENERATION (Ari+, ICLR'20)

Generation paper

https://arxiv.org/pdf/1904.09751.pdf 概要ニューラルテキスト生成モデルのdecodingに関する論文．ニューラルテキスト生成では単語ごとに生成確率を推定して，そのargmaxを取っていく形 (いわゆるgreedy decoding) や beam searchによる生成が一般的なア…

2017-10-14

Evaluation Metrics for Machine Reading Comprehension: Prerequisite Skills and Readability [Sugawara+, ACL'17]

QA Reading Comprehension paper

http://www.aclweb.org/anthology/P/P17/P17-1075.pdf 概要 Reading Comprehension(RC) タスクの目的の1つはモデルがどの程度文章を理解できるのかを測ることであり，コンテキストとなる文章を読んで関連する質問に答えられるかを問うことでそれを行う。し…

2017-09-29

Dynamic Entity Representations in Neural Language Models [Ji+, EMNLP'17]

paper coreference_resolution multi-task

https://aclanthology.coli.uni-saarland.de/papers/D17-1195/d17-1195 概要言語モデルとjointlyに共参照解析をして文章中のエンティティへの言及を元にその分散表現の更新を動的に行い，現在の隠れ状態に加えて最近登場したエンティティの分散表現を考慮す…

2017-09-07

Gated Self-Matching Networks for Reading Comprehension and Question Answering [Wang+, ACL'17]

SQuAD QA paper

https://www.aclweb.org/anthology/P/P17/P17-1018.pdf 概要 SQuAD QAでSOTAを出しましたという論文。会場で発表を聞いていたけどネットワークが複雑で一回だと良く分からなかった。改めてもう一度読んでも良く分からなかった。一応読んだのでメモ。 SQuAD…

2017-09-06

Learning to Compute Word Embeddings on the Fly [Bahdanau+, arXiv'17]

KB QA paper RTE

https://arxiv.org/abs/1706.00286 概要 Bahdanauの新作。従来の統計的テキスト処理では未知語はUNKトークンに変換された上で共通のものとして扱われるが、そこをWordNetの単語の定義文をエンコード（各単語ベクトルの平均 or LSTMの最終ステート）した補助…

2017-09-01

cloze-style QA まとめ

QA paper まとめ

cloze-style QAタスク(センター試験のような、文章を読んだ上でその文章に関するクエリのプレースホルダに正解の単語を埋める形式のQA) について読んだやつまとめ。（ある程度読んだら追加） CNN/Daily Mail QA Dataset Teaching Machines to Read and Compr…

2017-08-17

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses [Lowe+, ACL'17]

paper Dialogue

http://aclanthology.coli.uni-saarland.de/pdf/P/P17/P17-1103.pdf 概要学会中に発表聞きながら書いていたので短め。追記するかも。 How NOT to evaluate your dialogue system[Liu+, EMNLP'16] の著者の一人。上記の論文中でBLEUなどの翻訳用のmetricや…

2017-08-14

Learning to generate one-sentence biographies from Wikidata [Chisholm+, EACL'17]

KB paper Generation

https://aclweb.org/anthology/E17-1060 概要 Wikipediaは多くの場合その記事に対応するWikidata item (他エンティティとの関係ラベルやある属性の値などの知識グラフ) を持つことを利用して、ある人物についてWikidataから値を抽出したテンプレート (“TITL…

2017-08-05

An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention Combining Global Knowledge [Hao+, ACL'17]

paper QA KB

Question answering over knowledge base (KB-QA) に関する研究。タスクとしては [Unger+, ‘14] が先駆け？タスクの定義の細かい所が分かっていないのだが単なるQAタスクでも手がかりとしてKBを使っていたらKB-QA? 他タスクの手がかりとしてKBを使う、という…

2017-07-24

KB系 (link prediction) まとめ

NLP paper まとめ

最近KB周りがマイブームなので実装の参考も兼ねて KB + Text => Great KB な論文を多読してみたとそこから辿れる少し前の論文を斜め読み。基本的には (subject, relation, object) からなるtripleをグラフの2ノード間のラベル付きエッジとみなし、それぞれ…

2017-07-12

AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes [Rothe+, ACL'15]

paper NLP incomplete

http://www.aclweb.org/anthology/P15-1173 概要一回ちゃんと書いたやつが保存し忘れで消えてしまったので簡単にモデルの構成だけメモ。訓練済みのword embeddingsとWordnetのデータを使ってsynsetとlexemeについてもembeddingsを獲得するという研究。モデ…

2017-07-03

The Ubuntu Dialogue Corpus: A Large Dataset for Research in Unstructure Multi-Turn Dialogue Systems [Lowe+, SIGDIAL'15]

paper dialogue dataset

http://www.sigdial.org/workshops/conference16/proceedings/pdf/SIGDIAL40.pdf 概要 Ubuntu forumのチャットルームの会話を使ってデータセットを作った＆それを用いて応答選択タスクをやってみたという論文。データセットは長めのターン数（平均7.7ターン…

2017-07-01

Modeling Relational Data with Graph Convolutional Networks [Schlichtkrull+, arXiv'17]

paper

https://arxiv.org/pdf/1703.06103.pdf 概要 Graph Convolutional Network(GCN) を関係ラベル付き有向グラフも扱えるように拡張して、ノードのタイプの推定や欠けたエッジの補完を行う話。 Quitaの解説記事がとてもわかりやすいのであまり自分で書くことが…

2017-06-14

Adversarial Multi-task Learning for Text Classification [Liu+, ACL'17]

paper

概要元論文 ACL'17採録予定の論文。Multi-task learningのText classificationタスクへの応用。よくあるMulti-taskもののモデルではhidden layerやembedding layer全体をタスク間で共有する事が多く、そうした際に上手くタスク共有(shared)のパラメータとタ…

2017-05-10

Overcoming catastrophic forgetting in neural networks [Kirkpatrick+, arXiv'17]

paper multi-task

解説スライドを見つけたのでメモ。以前読んだ論文でもそうだったが、Multi-task Learningにおいて普通にそれぞれのタスクの最適化をしてしまうと前のタスクの情報を忘れてしまう、そのためにどうにかして前のタスクの重みを覚えておこうという話。全タスク…

2017-05-09

MULTI-TASK SEQUENCE TO SEQUENCE LEARNING [Luong+, ICLR'16]

paper multi-task

概要元論文前回に引き続きニューラルネットによるmulti-task learningもの。橋本さんの論文中のモデルでは各タスクを１つずつ解き状態ベクトルを後段のタスクへと渡していく構造であったが、それに対してこのモデルではEncoder-Decoderモデルで解けるそ…

2017-03-01

A Joint Many-Task Model: Growing a Neural Network for Multiple NLP Tasks [Hashimoto+, arXiv'16]

NLP paper multi-task

概要元論文鶴岡研の橋本さんの論文。単一のモデルで複数タスクを同時に解く事で全体性能を向上させる話。対象とするタスクは基礎的なものから順に POS Tagging, Word Chunking, Dependency Parsing, Semantic Relatedness, Textual Entailment．モデルの…

2016-06-23

Curriculum Learning [Bengio, ICML'09]

NLP paper

概要 Bengioの有名な論文。誰か読んでまとめた記事があるんじゃないかなと探してみたらとても分かりやすいのがあった。人間が物事を学習する時、いきなり難しい問題を与えられるよりも簡単なものから始まって徐々に難しくしていった方が効率よく学習が行え…

ブログではないです

ブログでなくはないです

paper

THE CURIOUS CASE OF NEURAL TEXT DeGENERATION (Ari+, ICLR'20)

Evaluation Metrics for Machine Reading Comprehension: Prerequisite Skills and Readability [Sugawara+, ACL'17]

Dynamic Entity Representations in Neural Language Models [Ji+, EMNLP'17]

Gated Self-Matching Networks for Reading Comprehension and Question Answering [Wang+, ACL'17]

Learning to Compute Word Embeddings on the Fly [Bahdanau+, arXiv'17]

cloze-style QA まとめ

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses [Lowe+, ACL'17]

Learning to generate one-sentence biographies from Wikidata [Chisholm+, EACL'17]

An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention Combining Global Knowledge [Hao+, ACL'17]

KB系 (link prediction) まとめ

AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes [Rothe+, ACL'15]

The Ubuntu Dialogue Corpus: A Large Dataset for Research in Unstructure Multi-Turn Dialogue Systems [Lowe+, SIGDIAL'15]

Modeling Relational Data with Graph Convolutional Networks [Schlichtkrull+, arXiv'17]

Adversarial Multi-task Learning for Text Classification [Liu+, ACL'17]

Overcoming catastrophic forgetting in neural networks [Kirkpatrick+, arXiv'17]

MULTI-TASK SEQUENCE TO SEQUENCE LEARNING [Luong+, ICLR'16]

A Joint Many-Task Model: Growing a Neural Network for Multiple NLP Tasks [Hashimoto+, arXiv'16]

Curriculum Learning [Bengio, ICML'09]