くじらはんど掲示板

くじらはんど用の掲示板です
[一覧へ] > (@6) [中] [解決]
@6■ (#18) 「Pythonによるスクレイピング&機械学習」のp.27、28について - yjr8 (2016-12-14 16:37) /中 未処理
こちらで質問していいものかどうかはわかりませんが、もし回答いただければ幸いです。

「Pythonによるスクレイピング&機械学習」という書籍を購入して、その本のAppendix1を元にDockerで開発環境を構築し、Appendix2を元にPythonとAnacondaの環境を構築して、ホストOSのホームディレクトリのマウントをしました。その後、最初のページに戻って手順どおりに進みました。

p.27の「任意のパラメーターを付けてリクエストを送信する方法」でpython3 download-zip.pyと入力して郵便番号150-0042に関する情報をXML形式で取得することはできたのですが、<ken><shi><cho><disp><kenkana><shikana><chokana>のところは空白になっていました。

また、p.28の「百人一首を検索するコマンドを自作してみよう」でコマンドラインからpython3 hyakunin.py と入力してキー入力を全角にして、日本語で「秋の田」と入力してENTERキーを押すと「秋の田」の文字が消えてしまいます。引数が英字なら問題なく入力できます。どうも日本語の入力、読み込みがうまくいっていないようです。どこに問題があるのか解決方法を教えていただけたら助かります。

使用しているパソコンのOSはWindows8.1です。よろしくお願いします。

(#19) 質問の返信 - クジラ飛行机 (2016-12-14 22:05) /中 未処理
「Pythonによるスクレイピング&機械学習」をお買い上げありがとうございました!

>p.27の「任意のパラメーターを付けてリクエストを送信する方法」でpython3 download-zip.pyと入力して郵便番号150-0042に関する情報をXML形式で取得することはできたのですが、<ken><shi><cho><disp><kenkana><shikana><chokana>のところは空白になっていました。

おかしいですね。改めて試してみましたが、私の環境では、正しく表示されます。

それで、いろいろ調べてみると、Docker for Windows で、まれにマルチバイト文字が表示されないという問題があるでそうです。これと同じ症状ですね。
参考) https://teratail.com/questions/40428

上記で、解決策では、ConEmuなどの、DOSプロンプト以外のWindowsターミナル環境を使うと良かったとありました。参考になれば幸いです。

参考) https://conemu.github.io/







(#20) 回答ありがとうございます - yjr8 (2016-12-15 16:25) /中 調査中
クジラ飛行机様、ご回答いただきありがとうございました。

上記の方法で試してみたいと思います。

(#21) 上記の方法で試しました - yjr8 (2016-12-15 19:11) /中 解決
ConEmuをダウンロードし、下のサイトの方法を使ってConEmuからDocker Toolboxを起動して試してみました。
http://qiita.com/murachi1208/items/c8a07c2f7848c4ec44b7

p.27の「任意のパラメーターを付けてリクエストを送信する方法」のほうは取得したXMLの中身は空白のままで変わらなかったものの、p.28の「百人一首を検索するコマンドを自作してみよう」のほうはうまく動作しました。また、p.40まで(bs-usd.py)試してみたところ問題なく動作しました。このまま続けてみようと思います。ありがとうございました。

(#18)へ返信する:

名前
タイトル
本文
優先度
状態
確認キー お手数ですが、いたずら防止のために、「真夏」の読み方を記入してください。
編集キー 編集時に使うキーを入力(省略可能)
添付ファイル 画像ファイル(最大300KB)を添付可能