nltkの例を実行するリソースu'tokenizerspunktenglish.pickle 'が見つかりません



Run Nltk Example Resource Utokenizers Punkt English



「Pythonデータマイニングの概念、方法、および実践」の第6章のテキストで、名前付きエンティティの認識を実行します。python3コードは次のとおりです。

import nltk import pprint filename = 'lkmlEmailsReduced.txt' with open(filename, 'r', encoding='utf8') as sampleFile: text=sampleFile.read() en = {} try: sent_detector = nltk.data.load('tokenizers/punkt/english.pickle') sentences = sent_detector.tokenize(text.strip()) 次のエラーが発生しました

リソース 'tokenizers / punkt /english.pickle'が見つかりません。お願いします



NLTKダウンローダーを使用してリソースを取得します:>>>

理由1:



次のことをしませんでした:

1、




  1. import nltk nltk.download()
  2. 正常に実行された後、NLTKダウンローダーがポップアップします。「すべて」をクリックしてダウンロードパスを変更します。「ダウンロード」してすべてのパッケージをダウンロードします。パスを覚えておいてください。次のパスを提案します
  3. 'C:\ Users \ Administrator / nltk_data'
    -'C:\ nltk_data '
    -'E:\ nltk_data '
    -'D:\ local \ Anaconda3 \ nltk_data '
    -'D:\ local \ Anaconda3 \ lib \ nltk_data '
    -'C:\ Users \ Administrator \ AppData \ Roaming \ nltk_data '


3.環境変数を構成します(デフォルトパスまたは上記のパス、あるいは推奨パスを使用する場合、構成は必要ありません)

サンプルプログラムを再度実行しても結果にエラーが報告される場合は、ファイルパスが原因です。以下を参照してください。

理由2:

理由1に従ってインストールした後も、エラーが報告されます。これはトークナイザーファイルパスが見つかりません。プログラム内のファイルアドレスを絶対アドレスに変更すれば問題ありません。

|_+_|

また、注意してください