RevSampler¶
- class unike.data.RevSampler(in_path: str = './', ent_file: str = 'entity2id.txt', rel_file: str = 'relation2id.txt', train_file: str = 'train2id.txt')[源代码]¶
在训练集中增加相反关系.
对于每一个三元组 (h, r, t),生成相反关系三元组 (t, r`, h): r` = r + rel_tol。
- __init__(in_path: str = './', ent_file: str = 'entity2id.txt', rel_file: str = 'relation2id.txt', train_file: str = 'train2id.txt')[源代码]¶
创建 RevSampler 对象。
- 参数:
in_path (str) – 数据集目录
ent_file (str) – entity2id.txt
rel_file (str) – relation2id.txt
train_file (str) – train2id.txt
- __weakref__¶
list of weak references to the object (if defined)
- ent2id: dict¶
实体->ID
- ent_file: str¶
entity2id.txt
- ent_tol: int¶
实体的个数
- get_hr2t_rt2h_from_train()¶
获得
hr2t_train和rt2h_train。
- get_train() list[tuple[int, int, int]]¶
返回训练集三元组。
- 返回:
- 返回类型:
list[tuple[int, int, int]]
- get_train_triples_id()¶
读取
train_file文件。
- hr2t_train: collections.defaultdict[set]¶
训练集中所有 h-r 对对应的 t 集合
- id2ent: dict¶
ID->实体
- id2rel: dict¶
ID->关系
- in_path: str¶
数据集目录
- rel2id: dict¶
关系->ID
- rel_file: str¶
relation2id.txt
- rel_tol: int¶
关系的个数
- rt2h_train: collections.defaultdict[set]¶
训练集中所有 r-t 对对应的 h 集合
- train_file: str¶
train2id.txt
- train_tol: int¶
训练集三元组的个数
- train_triples: list[tuple[int, int, int]]¶
训练集三元组