ginzaru関数 をテンプレートにして作成 - 井関龍太のページ
井関龍太のページ
ginzaru関数
をテンプレートにして作成
開始行:
*&color(#6A5ACD){ginzaruとは}; [#i9485575]
Rから日本語自然言語処理ライブラリの[[GiNZA>https://megago...
*&color(#6A5ACD){ginzaruのファイル}; [#o1fad7cb]
下のアイコンをクリックしてファイルを保存してください。
保存用のポップアップが表示されない場合は,右クリックして“...
&ref(ginzaru_110.R);
この関数を適用すると,以下のように分析結果が出力されます。
> ginzaru("メロスは激怒した。")
no Text Lemma POS Tag ...
1 0 メロス メロス PROPN 名詞-普通名詞-一般 ...
2 1 は は ADP 助詞-係助詞 ...
3 2 激怒 激怒 VERB 名詞-普通名詞-サ変可能 ...
4 3 し する AUX 動詞-非自立可能 サ行変...
5 4 た た AUX 助動詞 助動詞-...
6 5 。 。 PUNCT 補助記号-句点 ...
Reading Norm Shape Alpha Stop Dep Head HeadID ...
1 メロス メロス xxx TRUE FALSE nsubj 激怒 2 ...
2 ハ は x TRUE TRUE case メロス 0 ...
3 ゲキド 激怒 xx TRUE FALSE ROOT 激怒 2 [...
4 シ 為る x TRUE TRUE aux 激怒 2 ...
5 タ た x TRUE TRUE aux 激怒 2 ...
6 。 。 。 FALSE FALSE punct 激怒 2 ...
*&color(#6A5ACD){環境の構築}; [#dfb0aa10]
最初に使用する前に1回だけ行ってください。
すでにreticulateを利用中で,既存のPython環境にパッケージ...
Pythonやreticulateにくわしい方は必ずしも以下の手順通りで...
1. Rstudioを起動してreticulateパッケージをインストールし...
※まず,RとRstudioを現時点での最新版にしておくことをお勧め...
2. reticulateパッケージを起動してMinicondaをインストール...
library(reticulate)
install_miniconda()
3. 「Would you like to install Miniconda?」と尋ねられるの...
Y
たくさんメッセージが出てきます(とても長いです)。
すべてが終わって再びキー入力できる状態になったらRstudioを...
4. Windowsのスタートメニューから「Miniconda3」の中の「Ana...
5. コンソール画面が開くので以下を実行してください(Anacon...
pip install -U ginza ja_ginza
pip install sudachidict_full sudachidict_small
※2行目は必須ではありませんが,辞書のオプションを使用した...
すべてインストールが終了して再びキー入力できる状態になっ...
Anaconda Promptを閉じてください。
6. Rstudioを起動してください。
7. 「Tools」→「Global Options」→「Python」と展開し「Selec...
8. 「Conda Environments」のタブをクリック。
9. パッケージをインストールした環境(ここまでの手順通りな...
「OK」をクリックしてオプションを閉じてください。
Rstudioの再起動を求められるので「OK」をクリックしてくださ...
以上で終了です。
お疲れさまでした。
*&color(#6A5ACD){関数の使い方}; [#d5d40557]
**&color(#000080){関数のセット}; [#i649b519]
ダウンロードしたファイルをRに読み込みます。
1. Rstudioを起動します。
2. Rのメニューバーから「Code」をクリックします。
3. 現れたメニューの中から「Source File...」をクリックしま...
4. ファイルの選択画面になるので,関数のファイルを選んで「...
→Rのコンソールに「source("C:~」といったコードが表示され...
**&color(#000080){関数の実行}; [#s7e786f9]
以下のような形でコードを入力してください。
ginzaru(文字列, mode = 分析モード, dic = 辞書, model = ...
-文字列・・・分析したい文字列,または,文字列を格納した変...
-分析モード・・・A,B,Cの3種類が指定できます。Aは語をな...
-辞書・・・small,core,fullの3種類が指定できます。この並...
-モデル・・・ja_ginzaかja_ginza_electraの2種類が指定でき...
GiNZAは形態素解析・構文解析を行うだけでなく,他にも様々な...
ginzaru.Rには,ginzaru以外にもGiNZAの一部の機能を実行する...
これらの関数ではユーザーから見ての実行の容易さを優先させ...
また,これらの関数が対応していない機能に興味をお持ちの方...
***ginzame関数:MeCabと似た形式で形態素解析の結果を出力す...
ginzame(文字列, mode = 分析モード, dic = 辞書, model = ...
-オプションの内容はginzaruと同じです。
***ginsep関数:入力された文字列を文に分割する [#raf02460]
ginsep(文字列, mode = 分析モード, dic = 辞書, model = モ...
-オプションの内容はginzaruと同じです。
***ginbun関数:入力された文字列を文節に分割する [#h01c5e7e]
ginbun(文字列, mode = 分析モード, dic = 辞書, model = モ...
-出力形式・・・[[トークン形式>https://megagonlabs.github....
-他のオプションの内容はginzaruと同じです。
***ginnoun関数:名詞だけを取り出す [#qe0ee286]
ginnoun(文字列, mode = 分析モード, dic = 辞書, model = ...
-オプションの内容はginzaruと同じです。
***ginent関数:固有表現抽出を行う [#jfd0ab02]
ginent(文字列, mode = 分析モード, dic = 辞書, model = モ...
-ルール・・・デフォルトにない固有表現を抽出するためのルー...
-他のオプションの内容はginzaruと同じです。
***ginsim関数:コサイン類似度を計算する [#h162f245]
ginsim(文字列1, 文字列2, mode = 分析モード, dic = 辞書, ...
-文字列1,文字列2・・・分析対象の文字列です。2つの文字列...
-モデルのパス・・・類似度の計算にデフォルト以外の単語ベク...
-他のオプションの内容はginzaruと同じです。
***createModel関数:単語ベクトルを入れ替えてカスタムモデ...
createModel(入力パス, 出力パス, mode = 分析モード, dic =...
-入力パス・・・入力となる単語ベクトルモデルのパスを指定し...
-出力パス・・・出力先となるフォルダのパスを指定してくださ...
-他のオプションの内容はginzaruと同じです。
なお,この関数を使用するには,reticulateで使用するPython...
#br
終了行:
*&color(#6A5ACD){ginzaruとは}; [#i9485575]
Rから日本語自然言語処理ライブラリの[[GiNZA>https://megago...
*&color(#6A5ACD){ginzaruのファイル}; [#o1fad7cb]
下のアイコンをクリックしてファイルを保存してください。
保存用のポップアップが表示されない場合は,右クリックして“...
&ref(ginzaru_110.R);
この関数を適用すると,以下のように分析結果が出力されます。
> ginzaru("メロスは激怒した。")
no Text Lemma POS Tag ...
1 0 メロス メロス PROPN 名詞-普通名詞-一般 ...
2 1 は は ADP 助詞-係助詞 ...
3 2 激怒 激怒 VERB 名詞-普通名詞-サ変可能 ...
4 3 し する AUX 動詞-非自立可能 サ行変...
5 4 た た AUX 助動詞 助動詞-...
6 5 。 。 PUNCT 補助記号-句点 ...
Reading Norm Shape Alpha Stop Dep Head HeadID ...
1 メロス メロス xxx TRUE FALSE nsubj 激怒 2 ...
2 ハ は x TRUE TRUE case メロス 0 ...
3 ゲキド 激怒 xx TRUE FALSE ROOT 激怒 2 [...
4 シ 為る x TRUE TRUE aux 激怒 2 ...
5 タ た x TRUE TRUE aux 激怒 2 ...
6 。 。 。 FALSE FALSE punct 激怒 2 ...
*&color(#6A5ACD){環境の構築}; [#dfb0aa10]
最初に使用する前に1回だけ行ってください。
すでにreticulateを利用中で,既存のPython環境にパッケージ...
Pythonやreticulateにくわしい方は必ずしも以下の手順通りで...
1. Rstudioを起動してreticulateパッケージをインストールし...
※まず,RとRstudioを現時点での最新版にしておくことをお勧め...
2. reticulateパッケージを起動してMinicondaをインストール...
library(reticulate)
install_miniconda()
3. 「Would you like to install Miniconda?」と尋ねられるの...
Y
たくさんメッセージが出てきます(とても長いです)。
すべてが終わって再びキー入力できる状態になったらRstudioを...
4. Windowsのスタートメニューから「Miniconda3」の中の「Ana...
5. コンソール画面が開くので以下を実行してください(Anacon...
pip install -U ginza ja_ginza
pip install sudachidict_full sudachidict_small
※2行目は必須ではありませんが,辞書のオプションを使用した...
すべてインストールが終了して再びキー入力できる状態になっ...
Anaconda Promptを閉じてください。
6. Rstudioを起動してください。
7. 「Tools」→「Global Options」→「Python」と展開し「Selec...
8. 「Conda Environments」のタブをクリック。
9. パッケージをインストールした環境(ここまでの手順通りな...
「OK」をクリックしてオプションを閉じてください。
Rstudioの再起動を求められるので「OK」をクリックしてくださ...
以上で終了です。
お疲れさまでした。
*&color(#6A5ACD){関数の使い方}; [#d5d40557]
**&color(#000080){関数のセット}; [#i649b519]
ダウンロードしたファイルをRに読み込みます。
1. Rstudioを起動します。
2. Rのメニューバーから「Code」をクリックします。
3. 現れたメニューの中から「Source File...」をクリックしま...
4. ファイルの選択画面になるので,関数のファイルを選んで「...
→Rのコンソールに「source("C:~」といったコードが表示され...
**&color(#000080){関数の実行}; [#s7e786f9]
以下のような形でコードを入力してください。
ginzaru(文字列, mode = 分析モード, dic = 辞書, model = ...
-文字列・・・分析したい文字列,または,文字列を格納した変...
-分析モード・・・A,B,Cの3種類が指定できます。Aは語をな...
-辞書・・・small,core,fullの3種類が指定できます。この並...
-モデル・・・ja_ginzaかja_ginza_electraの2種類が指定でき...
GiNZAは形態素解析・構文解析を行うだけでなく,他にも様々な...
ginzaru.Rには,ginzaru以外にもGiNZAの一部の機能を実行する...
これらの関数ではユーザーから見ての実行の容易さを優先させ...
また,これらの関数が対応していない機能に興味をお持ちの方...
***ginzame関数:MeCabと似た形式で形態素解析の結果を出力す...
ginzame(文字列, mode = 分析モード, dic = 辞書, model = ...
-オプションの内容はginzaruと同じです。
***ginsep関数:入力された文字列を文に分割する [#raf02460]
ginsep(文字列, mode = 分析モード, dic = 辞書, model = モ...
-オプションの内容はginzaruと同じです。
***ginbun関数:入力された文字列を文節に分割する [#h01c5e7e]
ginbun(文字列, mode = 分析モード, dic = 辞書, model = モ...
-出力形式・・・[[トークン形式>https://megagonlabs.github....
-他のオプションの内容はginzaruと同じです。
***ginnoun関数:名詞だけを取り出す [#qe0ee286]
ginnoun(文字列, mode = 分析モード, dic = 辞書, model = ...
-オプションの内容はginzaruと同じです。
***ginent関数:固有表現抽出を行う [#jfd0ab02]
ginent(文字列, mode = 分析モード, dic = 辞書, model = モ...
-ルール・・・デフォルトにない固有表現を抽出するためのルー...
-他のオプションの内容はginzaruと同じです。
***ginsim関数:コサイン類似度を計算する [#h162f245]
ginsim(文字列1, 文字列2, mode = 分析モード, dic = 辞書, ...
-文字列1,文字列2・・・分析対象の文字列です。2つの文字列...
-モデルのパス・・・類似度の計算にデフォルト以外の単語ベク...
-他のオプションの内容はginzaruと同じです。
***createModel関数:単語ベクトルを入れ替えてカスタムモデ...
createModel(入力パス, 出力パス, mode = 分析モード, dic =...
-入力パス・・・入力となる単語ベクトルモデルのパスを指定し...
-出力パス・・・出力先となるフォルダのパスを指定してくださ...
-他のオプションの内容はginzaruと同じです。
なお,この関数を使用するには,reticulateで使用するPython...
#br
ページ名: