Skip to content

略称・定義規定の「~という。」・「~をいう。」文の解析をして、その中身を取り出すソフトウェア

License

Notifications You must be signed in to change notification settings

japanese-law-analysis/analysis_ryakusyou

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Workflow Status

analysis_ryakusyou

analysis_ryakusyou

略称・定義規定の「~という。」・「~をいう。」文の解析をして、その中身を取り出すソフトウェア

install

cargo install --git "https://github.com/japanese-law-analysis/analysis_ryakusyou.git"

その他の依存

動かすためには日本語の係り受け解析を行うためのjapanese-law-analysis/parse_japanese_dependencyというソフトウェアが必要です。手元などにcloneをし、このPythonスクリプトを動かすために必要なライブラリ・Python実行環境を整えてください。

Use

 analysis_ryakusyou --output output.json --py-path "path/to/parse_japanese_dependency.py" --work "path/to/law_xml_directory" --index-file "path/to/law_list.json" --article-info-file "path/to/words_law_info.json"

で起動します。また、オプション引数として--tmp-directory path/to/tmp_directoryが使えます。

それぞれのオプションの意味は以下の通りです。

  • --output:略称・定義規定から抜き出した単語などのリストを出力するJSONファイル名
  • --py-pathjapanese-law-analysis/parse_japanese_dependencyparse_japanese_dependency.pyファイルへのpath
  • --worke-gov法令検索からダウンロードした全ファイルが入っているフォルダへのpath
  • --index-filejapanese-law-analysis/listup_lawで生成した法令のリストが書かれているJSONファイルへのpath
  • --article-info-filejapanese-law-analysis/search_article_with_wordで生成した「という。」・「をいう。」が含まれる条文のリストが書かれたJSONファイルへのpath
  • --tmp-directory(オプション引数):一時ファイルの生成先フォルダへのpath(デフォルトは.
  • --do-not-use-cache(オプション引数):一時ファイルのキャッシュを使わないで全て生成するような挙動にする(デフォルトはキャッシュを使用)

MIT License (c) 2023 Naoki Kaneko (a.k.a. "puripuri2100")

License: MIT

About

略称・定義規定の「~という。」・「~をいう。」文の解析をして、その中身を取り出すソフトウェア

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages