bert-base-uncased-Hugging Face

84次阅读

bert-base-uncased-Hugging Face

BERT是一个transformers模型,它是在一个大型英文语料库上进行自监督预训练的。这意味着它仅在原始文本上进行预训练,没有任何人类以任何方式对其进行标注(这就是为什么它可以使用大量公开可用的数据、,并使用自动过程从这些文本中生成输入和标签。更准确地说,它是通过两个目标进行预训练的:

  • 掩码语言建模(MLM、:将一个句子,模型随机屏蔽输入中15%的单词,然后将整个屏蔽的句子通过模型运行,并预测屏蔽的单词。这与传统的递归神经网络(RNN、不同,后者通常一个接一个地看到单词,或者与GPT这样的自回归模型内部屏蔽未来的标记。它允许模型学习句子的双向表示。
  • 下一句预测(NSP、:模型在预训练期间将两个掩码句子连接在一起作为输入。有时它们对应于原始文本中相邻的句子,有时则不是。然后,模型必须预测这两个句子是否相互跟随。

通过这种方式,模型学习了英语语言的内部表示,然后可以用于提取对下游任务有用的特征:例如,如果您有一个标记的句子数据集,您可以使用BERT模型生成的特征作为输入来训练标准分类器。
本文URL:https://www.ainavpro.com/sites/2559.html

前往AI网址导航

正文完
 0
微草录
版权声明:本站原创文章,由 微草录 2024-01-02发表,共计501字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。