Skip to content

講談社サイエンティフィク 実践DataScienceシリーズ[Pythonではじめるテキストアナリティクス入門]

Notifications You must be signed in to change notification settings

Kia-GSII/kspub_ds_text_analytics

 
 

Repository files navigation

Pythonではじめるテキストアナリティクス入門:サポートページ

概要

書影

これはmainブランチです.

branch名 内容
main プログラムの出力結果は書籍と同一だが,一部プログラムの書き方や説明に修正を加えたもの
original_book 書籍と同一のプログラム.

活用方法

  1. 書籍の第3章 環境構築を参照しながら、下記を実行してください。
    • Pythonのインストール(Chapter03/setup_python.md )
    • Python仮想環境の構築(Chapter03/setup_pyenv.md)
    • MeCabのインストール(Chapter03/setup_MeCab.md )
      • 書籍ではMeCabのインストールは9章で紹介されていますが,GiNZAでは不向きな処理のために随所でMeCabを利用しているため、最初にインストールするようにしてください.
  2. Jupyter Notebookが実行可能な環境をセットアップしてください。下記は書籍に準拠した場合のセットアップ方法です。
pyenv local 3.9.5
pip install jupyterlab
  1. 本リポジトリをダウンロードし、Jupyter Notebookが実行可能な環境を立ち上げて下さい。
    • jupyter-lab以外にJupyter-notebookやVisual Studio Codeなどでも利用可能 です
    • jupyter-lab以外にJupyter-notebookやVisual Studio Codeなどでも利用可能です
$ git clone [email protected]:tksakaki/kspub_ds_text_analytics.git
$ cd kspub_ds_text_analytics
$ jupyter-lab 

補足

  • 本リポジトリは第4章のコードから順番に実行していくことを想定しています。そのため、順不同で実行すると、Pythonのパッケージが不足することがあります。順番を気にせず実行したい方は、下記のコマンドで利用する全パッケージを予めインストールしてください。
$ cd kspub_ds_text_analytics
$ pip install -r requirements.txt

注意点

  • 書籍に記載されている結果は、可能な限り多くの環境で同一の結果が出るように努めていますが、OS/Linuxパッケージ/Pythonパッケージの組み合わせにより、一致しないことは十分に起き得ます。多少の相違はご容赦下さい。

    • 極力合わせたい方は、下記のようのPythonパッケージを最初にインストールすることをおすすめします

      • $ pip install -r requirements.txt
        
  • 第2部 6、8章のコードには、ご自身でデータを収集しないと動かないコードが含まれています。お手数をおかけしますが、幅広く読まれる書籍という性質上、ご理解頂けると幸いです(8章については、ご自身で簡単にデータを収集するコードが含まれています)。

その他

About

講談社サイエンティフィク 実践DataScienceシリーズ[Pythonではじめるテキストアナリティクス入門]

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 86.1%
  • HTML 12.8%
  • Python 1.1%