pygeonlp.api.devtool module

pygeonlp.api.devtool.pp_geojson(geojson_list, indent=2, file=None)

geoparse() の結果(GeoJSON互換)を pretty print します。

パラメータ:
  • geojson_list (list) -- geoparse() 結果の GeoJSON 互換 dict のリスト。

  • indent (int, optional) -- インデント幅。デフォルトは2です。

  • file (file descriptor, optional) -- 出力先のファイルデスクリプタ。デフォルトは None です。

サンプル

>>> import pygeonlp.api as api
>>> from pygeonlp.api.devtool import pp_geojson
>>> api.init()
>>> pp_geojson(api.geoparse('アメリカ大使館:港区赤坂'))
アメリカ大使館 : 【港区赤坂:['東京都', '港区', '赤坂']】 EOS
pygeonlp.api.devtool.pp_lattice(lattice, indent=2, file=None)

ラティス表現のデータを pretty print します。

パラメータ:
  • lattice (list) -- 解析結果のラティス表現。

  • indent (int, optional) -- インデント幅。デフォルトは2です。

  • file (file descriptor, optional) -- 出力先のファイルデスクリプタ。デフォルトは None です。

サンプル

>>> import pygeonlp.api as api
>>> from pygeonlp.api.devtool import pp_lattice
>>> api.init()
>>> parser = api.parser.Parser(jageocoder=True)
>>> lattice = parser.analyze_sentence('アメリカ大使館:港区赤坂1-10-5')
>>> pp_lattice(lattice)
#0:'アメリカ大使館'
  アメリカ大使館(NORMAL)
#1:':'
  :(NORMAL)
#2:'港区'
  港区(GEOWORD:['東京都'])
  港区(GEOWORD:['愛知県', '名古屋市'])
  港区(GEOWORD:['大阪府', '大阪市'])
#3:'赤坂'
  赤坂(GEOWORD:['上毛電気鉄道', '上毛線'])
  赤坂(GEOWORD:['東京地下鉄', '9号線千代田線'])
  赤坂(GEOWORD:['富士急行', '大月線'])
  赤坂(GEOWORD:['福岡市', '1号線(空港線)'])
#4:'1'
  1(NORMAL)
#5:'-'
  -(NORMAL)
#6:'10'
  10(NORMAL)
#7:'-'
  -(NORMAL)
#8:'5'
  5(NORMAL)
>>> lattice_address = parser.add_address_candidates(lattice, True)
>>> pp_lattice(lattice_address)
#0:'アメリカ大使館'
  アメリカ大使館(NORMAL)
#1:':'
  :(NORMAL)
#2:'港区'
  港区(GEOWORD:['東京都'])
  港区(GEOWORD:['愛知県', '名古屋市'])
  港区(GEOWORD:['大阪府', '大阪市'])
  港区赤坂1-10-(ADDRESS:東京都/港区/赤坂/一丁目/10番)[6]
#3:'赤坂'
  赤坂(GEOWORD:['上毛電気鉄道', '上毛線'])
  赤坂(GEOWORD:['東京地下鉄', '9号線千代田線'])
  赤坂(GEOWORD:['富士急行', '大月線'])
  赤坂(GEOWORD:['福岡市', '1号線(空港線)'])
#4:'1'
  1(NORMAL)
#5:'-'
  -(NORMAL)
#6:'10'
  10(NORMAL)
#7:'-'
  -(NORMAL)
#8:'5'
  5(NORMAL)
>>> lattice_address_compact = parser.add_address_candidates(lattice)
>>> pp_lattice(lattice_address_compact)
#0:'アメリカ大使館'
  アメリカ大使館(NORMAL)
#1:':'
  :(NORMAL)
#2:'港区赤坂1-10-'
  港区赤坂1-10-(ADDRESS:東京都/港区/赤坂/一丁目/10番)[6]
#3:'5'
  5(NORMAL)
pygeonlp.api.devtool.pp_mecab(geojson_list, file=None)

geoparse() の結果(GeoJSON互換)を mecab 類似書式で出力します。

パラメータ:
  • geojson_list (list) -- geoparse() 結果の GeoJSON 互換 dict のリスト。

  • file (file descriptor, optional) -- 出力先のファイルデスクリプタ。デフォルトは None です。

サンプル

>>> import pygeonlp.api as api
>>> from pygeonlp.api.devtool import pp_mecab
>>> pp_mecab(api.geoparse('目黒駅は品川区にあります。'))
目黒駅  名詞,固有名詞,地名語,Xy26iV:目黒駅,*,*,目黒駅,, 鉄道施設/鉄道駅,Xy26iV,目黒駅,139.71566,35.632485
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
品川区  名詞,固有名詞,地名語,kEAYBl:品川区,*,*,品川区,, 市区町村,kEAYBl,品川区,139.73025000,35.60906600
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
あり    動詞,自立,*,*,連用形,五段・ラ行,ある,アリ,アリ
ます    助動詞,*,*,*,基本形,特殊・マス,ます,マス,マス
。      記号,句点,*,*,*,*,。,。,。
EOS
pygeonlp.api.devtool.pp_path(path, indent=2, file=None)

パス表現のデータを pretty print します。

パラメータ:
  • path (list) -- 解析結果のパス表現。

  • indent (int, optional) -- インデント幅。デフォルトは2です。

  • file (file descriptor, optional) -- 出力先のファイルデスクリプタ。デフォルトは None です。

サンプル

>>> import pygeonlp.api as api
>>> from pygeonlp.api.linker import LinkedResults
>>> from pygeonlp.api.devtool import pp_path
>>> api.init(jageocoder=False)
>>> lattice = api.analyze('アメリカ大使館:港区赤坂1-10-5')
>>> for path in LinkedResults(lattice):
...   pp_path(path)
...
[
  #0:アメリカ大使館(NORMAL)
  #1::(NORMAL)
  #2:港区(GEOWORD:['東京都'])
  #3:赤坂(GEOWORD:['上毛電気鉄道', '上毛線'])
  #4:1(NORMAL)
  #5:-(NORMAL)
  #6:10(NORMAL)
  #7:-(NORMAL)
  #8:5(NORMAL)
]
[
  #0:アメリカ大使館(NORMAL)
  #1::(NORMAL)
  #2:港区(GEOWORD:['東京都'])
  #3:赤坂(GEOWORD:['東京地下鉄', '9号線千代田線'])
  #4:1(NORMAL)
  #5:-(NORMAL)
  #6:10(NORMAL)
  #7:-(NORMAL)
  #8:5(NORMAL)
]
...