漢字をひらがなに変換する – Yahoo テキスト解析:日本語形態素解析 –
駅データ拡張の一環として、駅名に読みがなを付加しようとしたのだが、いかんせん量が多いので、自動化できないかと考えて、「漢字をひらがなに変換する」Webサービスを探してみた。
その中で、Yahooが提供する「テキスト解析:日本語形態素解析」がよさそうだったので、早速使ってみた。もちろん、誤変換があるので、読みがな作成を完全自動化できるわけではなく、あくまで第1候補を提示する、という位置づけとする。
このサービスは、「日本語文を形態素に分割し、品詞、読みがなの付与、統計情報を取得できる機能を提供」するもので、今回は入力が駅名なので、すでに形態素に分割された文字列に、読みがなを付加する機能のみを使うことになる。(なお、YahooのアプリケーションIDが必要。)
使い方:以下のリクエストを投げる
http://jlp.yahooapis.jp/MAService/V1/parse?appid=myappid&results=ma&sentence=target
必須パラメータは以下の3つ。
- appid : アプリケーションID
リクエスト数には上限がある点に留意のこと。 - sentence : 解析したい文(駅名)
UTF-8でエンコードすること。 - results : 結果
解析結果は(少々やっかいなことに)XML形式で返される。これをJSON(JSONP)で取り扱う方法は別途説明する。
[…] 前記事の「Yahooテキスト解析 Webサービス」の解析結果はXML形式で返されるので、取り扱いが少々面倒だ。そこで、Yahoo Query Language (YQL) を使って、これをJSON(JSONP)形式に変換する。(解説記事はこれ。) […]
[…] ・駅データ画面: 読み仮名やローマ字、関連する写真・画像の枚数を入力する。読み仮名欄が空白の場合、Webサービスを利用して、駅名(漢字)をひらがなに変換して仮設定している。(漢字をひらがなに変換する方法) […]