Tweeted By @seb_ruder

on 2018-10-12 (UTC)
nlp research

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding:
SOTA on 11 tasks. Main additions:
- Bidirectional LM pretraining w/ masking
- Next-sentence prediction aux task
- Bigger, more data
It seems LM pretraining is here to stay.https://t.co/lV8TkBXxY5
— Sebastian Ruder (@seb_ruder) October 12, 2018

Tags