torcharrow.functional.get_jaccard_similarity¶
- torcharrow.functional.get_jaccard_similarity(input_ids: ListColumn, matching_ids: ListColumn)¶
返回 input_ids 和 matching_ids 之間的 Jaccard 相似度。Jaccard 相似度為 |input_ids 與 matching_ids 的交集|/|input_ids 與 matching_ids 的聯集|
- 參數:
input_ids (第一個 id 列表) –
matching_ids (第二個 id 列表) –
範例
>>> import torcharrow as ta >>> from torcharrow import functional >>> input_ids = ta.column([[1, 1, 2, 3],[5,8],[13]]) >>> matching_ids = ta.column([[1,2,3],[2,3],[13,13,13,13,13]]) >>> functional.get_jaccard_similarity(input_ids, matching_ids) 0 0.75 1 0 2 0.2 dtype: Float32(nullable=True), length: 3, null_count: 0