【ソーシャルリスニング】WordCloudでAmazonレビューを可視化【Pythonでデータ分析】

  • このエントリーをはてなブックマークに追加
スポンサーリンク

この記事を読むのに必要な時間は約 6 分です。

 

ソーシャルリスニングとは?

Twitter、InstagramをはじめとしたSNSや、通販サイトの口コミレビューなどから、

消費者が行っている発言を集めてきて業界や商品に関する大まかな動向を把握するマーケティング手法です。

今回は、Pythonのライブラリ(BeautifulSoup/WordCloudなど)を用いて、Amazonの商品レビューから「Allbirds」のスニーカーの評価を可視化してみようと思います。

WordCloudとは、下記のような感じで、重要度の高い単語が大きく表示されるような可視化ライブラリです。

参考①:Beautiful Soup Documentation

参考②:WordCloud for Python documentation

環境

Google Colab

手順

前準備(Amazonレビューページからスクレイピング)

まずは、Amazonからレビューを取得したい商品を検索し、商品ページのURLを用意します。

効率的にレビュー文を集めるため、商品URLの/dp/の部分を/product-reviews/に変更し、読み取り先をAmazonレビューページにしておきます。

レビューページを次々と進んで、スクレイピング(Beautifulsoup)によって、レビュー箇所を抜き出していきます。

※下記スクレイピング用のget_all_reviews()関数はこちらのQiita記事からコードを引用しました。

参考:PythonでAmazonのレビューをサーチ

ページ全体から抽出したレビュー部分から、さらにテキスト部分だけを抜き出して一つの文にまとめていきます。

抜き出してまとめたレビュー結果は以下のような感じです。(一部抜粋)

靴を買おうと思って探していたわけではなかったのですが、「世界一快適」という売り文句が気になりに試しに購入してみました。履き心地は足が靴に締め付けられる感じがなく非常に楽で、通気性もいい上に1月といことで外は寒いですが、足が冷えることは今のところないです(安い手袋を付けていて手は完全に冷えている状態でしたが、足は靴のおかげかなんともなかったです)。自分は普通のスニーカーは27cmのものをよく買いますが、こちらの商品だとワンサイズ上のもの(US11)の方が合っていました。また、足幅が広く、いつも靴選びにその点で困っていますが、こちらの商品ではその点も問題なかったです。値段は高めですが、非常に良い商品だと思うので、夏の履き心地と耐久性に難がなければ、リピート購入をしたいと思います。追記:2020年から日本でも発売する店舗が東京にできるとのことだったので、ネットでの購入価格も安くなるかもしれません。期待大。

快適です。特にソールの柔らかさが尋常じゃない。素材的にアッパーが柔らかいのは想像できるし、商品写真や動画で見た通りの感触です。ソールはすごく柔らかいけど、クッション性もちゃんとある。サイズは他の方のレビュー通り普段よりワンサイズ大きめでちょうどいいです。会社の上司からの情報で購入しましたが、最高です。ちなみにその上司は、今後スニーカーはこれしか履かないと言っています。

履き心地が最高です!快適すぎて他メーカーの靴が履けなくなってしまい3足買わせて頂きました!(グレー、ホワイト、サンキスト)今後も増えていく予定です!唯一、欠点を上げると雨では履けないのが辛いです!

期待していた通り、すごく軽いです。そして何より、履き心地がすごく良いと思います!歩き疲れることがほぼないと思いますし、自分は靴擦れもなかったです。洗濯機でも、1度洗いましたが、ちゃんと普通に洗えましたw

温かくて通気性があることが気に入っています。

ここまでできたら、一旦スクレイピングした結果をテキストファイルとして残しておきます。

レビュー文を形態素解析

形態素解析エンジンの「Mecab」をインストールしていきます。

!apt install aptitude
!aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y
!pip install mecab-python3==0.7

Mecabを使って単語レベルで分割していきます。

上のコードで形態素解析した結果はこちらです。

Mecabで形態素解析をすると、品詞別に単語が分けられていくみたいですね。

‘靴\t名詞,一般,*,*,*,*,靴,クツ,クツ\nを\t助詞,格助詞,一般,*,*,*,を,ヲ,ヲ\n買お\t動詞,自立,*,*,五段・ワ行促音便,未然ウ接続,買う,カオ,カオ\nう\t助動詞,*,*,*,不変化型,基本形,う,ウ,ウ\nと\t助詞,格助詞,引用,*,*,*,と,ト,ト\n思っ\t動詞,自立,*,*,五段・ワ行促音便,連用タ接続,思う,オモッ,オモッ\nて\t助詞,接続助詞,*,*,*,*,て,テ,テ\n探し\t動詞,自立,*,*,五段・サ行,連用形,探す,サガシ,サガシ\nて\t助詞,接続助詞,*,*,*,*,て,テ,テ\nい\t動詞,非自立,*,*,一段,連用形,いる,イ,イ\nた\t助動詞,*,*,*,特殊・タ,基本形,た,タ,タ\nわけ\t名詞,非自立,一般,*,*,*,わけ,ワケ,ワケ\nで\t助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ\nは\t助詞,係助詞,*,*,*,*,は,ハ,ワ\nなかっ\t形容詞,自立,*,*,形容詞・アウオ段,連用タ接続,ない,ナカッ,ナカッ\nた\t助動詞,*,*,*,特殊・タ,基本形,た,タ,タ\nの\

今回の場合、品詞情報は邪魔になるので削除していきます。

WordCloudで分析結果を可視化

ここでようやくWordCloudの出番です。

GoogleColabはデフォルトで日本語に対応していないので、IPAフォントを入れておきます。

!sudo apt-get install fonts-ipafont  

これまで加工してきたkeywordsからWordCloudを生成します。

分析結果はこちらです。

やっぱりAllbirdsは前評判通りに履き心地が良く、快適みたいですね。

スポンサーリンク

  • このエントリーをはてなブックマークに追加
スポンサーリンク