segment_ids 有什么用呢 #484

FortuneStar · 2022-07-18T09:03:42Z

token_ids, segment_ids = tokenizer.encode(d['text'], maxlen=maxlen)
这句代码中返回值中的segment_ids，我分析了一下源码，大概是这个意思，句子A和句子B分隔符，句子A对应的全为0，句子B对应的全为1。但是不知道有什么用，可能我问的问题比较肤浅(´･_･`)，之前用huggingface里面的bert，返回值貌似是没有这项的。

bojone · 2022-07-21T09:30:23Z

token_ids, segment_ids = tokenizer.encode(d['text'], maxlen=maxlen) 这句代码中返回值中的segment_ids，我分析了一下源码，大概是这个意思，句子A和句子B分隔符，句子A对应的全为0，句子B对应的全为1。但是不知道有什么用，可能我问的问题比较肤浅(´･_･`)，之前用huggingface里面的bert，返回值貌似是没有这项的。

bert的返回值是没有的，bert的输入值有啊，这就是bert自带的设计，初衷是想要区分两个拼接的句子。

liyunhan · 2022-07-30T09:17:25Z

token_ids, segment_ids = tokenizer.encode(d['text'], maxlen=maxlen) 这句代码中返回值中的segment_ids，我分析了一下源码，大概是这个意思，句子A和句子B分隔符，句子A对应的全为0，句子B对应的全为1。但是不知道有什么用，可能我问的问题比较肤浅(´･_･`)，之前用huggingface里面的bert，返回值貌似是没有这项的。

bert的返回值是没有的，bert的输入值有啊，这就是bert自带的设计，初衷是想要区分两个拼接的句子。

请问苏神bert4keras最高就支持tensorflow2.3以下版本吗

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

segment_ids 有什么用呢 #484

segment_ids 有什么用呢 #484

FortuneStar commented Jul 18, 2022

bojone commented Jul 21, 2022

liyunhan commented Jul 30, 2022

segment_ids 有什么用呢 #484

segment_ids 有什么用呢 #484

Comments

FortuneStar commented Jul 18, 2022

bojone commented Jul 21, 2022

liyunhan commented Jul 30, 2022