nltkダウンロード( 'punkt')接続試行の失敗を解決します



Solve Failure Nltk Download Connection Attempt



nltkダウンロード(「パンク」)接続試行の失敗を解決します

元のリンク:https://blog.csdn.net/weixin_44633882/article/details/104494276

1.ダウンロードしてみてください

import nltk nltk.download() >d punkt

このメソッドは、一方ではnltkファイルが大きいため、他方では現在のネットワークが安定していないため、2番目のステップで「接続試行に失敗しました」をスローします。



2.解決策

直接ダウンロードすることはできないため、ダウンロードするファイルと保存場所を確認する必要があります。次に、自分でダウンロードして、指定されたディレクトリに配置します。

必要なnltkワードセグメンテーションコードを実行します



import nltk nltk.word_tokenize('A pivot is the pin or the central point on which something balances or turns')

例外をスローします

Traceback (most recent call last): File '', line 1, in File 'C:ApplicationsAnaconda3libsite-packages ltk okenize\__init__.py', line 144, in word_tokenize ... File 'C:ApplicationsAnaconda3libsite-packages ltkdata.py', line 701, in find raise LookupError(resource_not_found) LookupError: ********************************************************************** Resource punkt not found. Please use the NLTK Downloader to obtain the resource: >>> import nltk >>> nltk.download('punkt') For more information see: https://www.nltk.org/data.html Attempted to load tokenizers/punkt/english.pickle Searched in: - 'C:\Users\11244/nltk_data' - 'C:\Applications\Anaconda3\nltk_data' - 'C:\Applications\Anaconda3\share\nltk_data' - 'C:\Applications\Anaconda3\lib\nltk_data' - 'C:\Users\11244\AppData\Roaming\nltk_data' - 'C:\nltk_data' - 'D:\nltk_data' - 'E:\nltk_data' - '' **********************************************************************

tokenizers/punkt/english.pickleファイルを読み込もうとしているのに、見つかりませんでした。システムは'C:\Users\11244/nltk_data'これらのパスの下で検索を開始します。

OK、必要なファイルとこのファイルを配置する場所はわかっています。どこからダウンロードできますか?



アクセス nltk_data 、直接ダウンロードする必要のあるパッケージを選択し、今すぐパスに従って配置することができます。約14分かかります。

Githubのネットワークは最近不安定です。 githubダウンロードアドレスの代わりに別のダウンロードアドレスを見つけましょう。

右に引く

ここからのダウンロードは高速です(● ’◡’●)。Thunderに入れることをお勧めします!

ダウンロード済みpunkt.zipファイル、私はそれを置くことを選択しますC:\Applications\Anaconda3\share\nltk_dataディレクトリの下で、解凍を完了します。

λ python Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)] on win32 Type 'help', 'copyright', 'credits' or 'license' for more information. >>> import nltk >>> nltk.word_tokenize('A pivot is the pin or the central point on which something balances or turns') ['A', 'pivot', 'is', 'the', 'pin', 'or', 'the', 'central', 'point', 'on', 'which', 'something', 'balances', 'or', 'turns']

3.まとめ

githubでプロジェクトを使用する必要があるため、ダウンロードするだけでnltkライブラリ内punkt、ダウンロードしただけです。

それが他の人にも役立つことを願っています!

参照

  1. https://blog.csdn.net/qq_43376013/article/details/102883773
  2. https://blog.csdn.net/weixin_44574186/article/details/90748946
  3. https://www.cnblogs.com/zrmw/p/10869325.html