From c32547c2b0bf7aa2148fe85e47f253bbccc278e1 Mon Sep 17 00:00:00 2001 From: Yuuki Toriyama Date: Sat, 16 Nov 2024 18:33:32 +0900 Subject: [PATCH] =?UTF-8?q?update:=20#454:=20=E3=80=8C=E6=9D=BE=E5=B8=86?= =?UTF-8?q?=E6=93=BD=E7=94=B0=E3=80=8D=E3=81=A8=E3=80=8C=E6=9D=BE=E5=B8=86?= =?UTF-8?q?=E6=AB=9F=E7=94=B0=E3=80=8D=E3=81=AE=E8=A1=A8=E8=A8=98=E3=82=86?= =?UTF-8?q?=E3=82=8C=E3=81=AB=E5=AF=BE=E5=BF=9C?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- core/src/adapter/orthographical_variant_adapter.rs | 2 ++ core/src/tokenizer/read_town.rs | 1 + ...02\214\343\201\270\343\201\256\345\257\276\345\277\234.csv" | 3 +++ 3 files changed, 6 insertions(+) diff --git a/core/src/adapter/orthographical_variant_adapter.rs b/core/src/adapter/orthographical_variant_adapter.rs index 069d590..cc73589 100644 --- a/core/src/adapter/orthographical_variant_adapter.rs +++ b/core/src/adapter/orthographical_variant_adapter.rs @@ -33,6 +33,7 @@ pub enum OrthographicalVariant { 鷆, 斑, 櫻, + 櫟, } impl OrthographicalVariant { @@ -71,6 +72,7 @@ impl OrthographicalVariant { OrthographicalVariant::鷆 => &['鷆', '鷏'], OrthographicalVariant::斑 => &['斑', '班'], OrthographicalVariant::櫻 => &['櫻', '桜'], + OrthographicalVariant::櫟 => &['櫟', '擽'], } } diff --git a/core/src/tokenizer/read_town.rs b/core/src/tokenizer/read_town.rs index dfe3671..4789b60 100644 --- a/core/src/tokenizer/read_town.rs +++ b/core/src/tokenizer/read_town.rs @@ -95,6 +95,7 @@ fn find_town(input: &str, candidates: &Vec) -> Option<(String, String)> OrthographicalVariant::鷆, OrthographicalVariant::斑, OrthographicalVariant::櫻, + OrthographicalVariant::櫟, ], }; if let Some(result) = adapter.apply(input, candidate) { diff --git "a/tests/test_data/\347\225\260\345\255\227\344\275\223\343\201\247\343\201\257\343\201\252\343\201\204\350\241\250\350\250\230\343\202\206\343\202\214\343\201\270\343\201\256\345\257\276\345\277\234.csv" "b/tests/test_data/\347\225\260\345\255\227\344\275\223\343\201\247\343\201\257\343\201\252\343\201\204\350\241\250\350\250\230\343\202\206\343\202\214\343\201\270\343\201\256\345\257\276\345\277\234.csv" index ba065e8..f76a6bd 100644 --- "a/tests/test_data/\347\225\260\345\255\227\344\275\223\343\201\247\343\201\257\343\201\252\343\201\204\350\241\250\350\250\230\343\202\206\343\202\214\343\201\270\343\201\256\345\257\276\345\277\234.csv" +++ "b/tests/test_data/\347\225\260\345\255\227\344\275\223\343\201\247\343\201\257\343\201\252\343\201\204\350\241\250\350\250\230\343\202\206\343\202\214\343\201\270\343\201\256\345\257\276\345\277\234.csv" @@ -9,3 +9,6 @@ address,prefecture,city,town,rest # 「斑目」と「班目」の表記揺れへの対応 神奈川県南足柄市班目639,神奈川県,南足柄市,班目,639 神奈川県南足柄市斑目639,神奈川県,南足柄市,班目,639 +# 「櫟」と「擽」の表記ゆれへの対応 +兵庫県南あわじ市松帆櫟田196,兵庫県,南あわじ市,松帆櫟田,196 +兵庫県南あわじ市松帆擽田196,兵庫県,南あわじ市,松帆櫟田,196