趣味と仕事の境界線・・・・・・

困ったこと・調べたこと・勉強したこと・興味の湧いたこと。今蒔く種が未来となるように。

Windows 7 でhttps 対応URL からwget できなくて困った話

f:id:toyoyo:20190520172032p:plain

今回は本当にタイトル通りに困った話。 Windows 7 の余命もあと一年をきったものの、まだまだ現役で使用中の方もおられるかと思うので記録しておきます。

すっかりhttps 対応が当たり前になったWeb サイトですが、今回たまたまwget してデータを抜き取りたいサイトがございまして、例に漏れず当該のサイトもhttps だったのです。

コマンドはGit Bash が入ってるので、そちらからwget のインストールを済ませ、いざ「wget!」・・・したら出ましたよ。

エラーメッセージが・・・。

Unsupported scheme

ここで早とちりをひとつ「wget ってhttps に対応してないの?ガーンっ!」という思い込み。 しかし、調べたらオプション(--no-check-certificate)ひとつで回避できるとのこと。やれやれ人騒がせな・・・。

zakkiweb.net

オプションを付与して、再び「wget!」・・・あかーん。なんでや。。。

更に更に調査を進めると、エラーメッセージの「Unsupported scheme」から読み解けたひとつの結論。 それはズバリ「wget のバージョンが古い」ということ。

バージョンを確認して「ヤバっ!私のwget 古すぎ・・・」という顔になりました。

しかし、さっき最新をインストールしたつもりだったのになぁ・・・と思いながら、慎重を期して「Windows7 wget インストール 最新」と検索していくつかのサイトで手順を確認してから改めてインストール。

sites.google.com

www.youfit.co.jp

インストール完了後に念のため「which wget」で場所を確認すると、やはり2つある。。。 バージョンを確認すると、パスが優先される方に古いものが入っていて、コイツが犯人と確定。

Windows のパスの優先順については下記の記事を参考にしました。

takuya-1st.hatenablog.jp

こうして無事に「wget」に成功してサイト情報のダウンロードに成功したと思ったのですが、残念ながら望みのデータは落とせていなかったのでした。。。

しかし、「wget」が失敗するという問題は解決できたので、この話はここまでとなります。めでたしめでたし。

新たな問題についての七転八倒については機会があればまたいつか。

wget コマンドのオプションについてはこちら。

www.atmarkit.co.jp

久々に使用してすっかり忘れておりました。スクレイピングのお仕事をしたときだから、もう数年前のこと。 やはり、そろそろWindows 10 にアップデートしようか。そして、環境を白紙に戻そうかなぁ。。。

その後は全ての開発環境を仮想環境にて用意することにしよう。

既にWindows 7 がParallels の仮想環境上なのだけれど・・・いや、待てよ仮想環境上で更に仮想環境を立てるって大丈夫なのだろうか?

新たな課題が出てきて困った困った。。。