admin管理员组

文章数量:1652183

预处理模块


模型组成

模块细节

batch_size是12,seq_len是256,hidden_size是768,注意由于输入都是单句,所以token_type_ids其实都是0

本文标签: 源码ApproachLearningContrastiveClassification