無料ブログはココログ

« June 2017 | Main | August 2017 »

July 05, 2017

続・テキストマイニングに興味がある人へ

前回評判がよかったので(Twitterで何人もの方にリツイートしていただきました)、第2弾を書きました。

●テキストマイニングに関する参考文献

(1)豊田裕貴/菰田 文男(2011)
『特許情報のテキストマイニング―技術経営のパラダイム転換』
https://www.amazon.co.jp/dp/4623059766/
 前回のリストに入れたかったのですが、品切れ絶版のようなので遠慮しました。ミネルヴァ書房の方には是非改訂版を検討していただきたいです。
 私がテキストマイニングという技術を知ったのは本書によるものなので、ご紹介したかったです。理論編は難しく、テキストマイニングというのは難解な技術なのではないか、と思いましたが、実践編はよく理解できます。
 ここに「Text Mining Studio」という商用ソフトの試供版を試せると書いてあるのですが、元の会社がNTT数理データシステムに吸収されてしまったので、試供版は試せません。
但し、商品説明会にいけば、インストール後1ケ月は無料で使えるサンプルCDをもらえます。テキストマイニングの説明もしてくれるので、興味がある人は行ってみるとよいでしょう。
NTT数理データシステムwebsite https://www.msi.co.jp/tmstudio/

(2)服部兼敏(2010)
『テキストマイニングで広がる看護の世界』
https://www.amazon.co.jp/dp/4779505119/
 看護や医療の世界ではテキストマイニングが流行って(?)いるようです。こういう観点でテキストマイニングについて書籍化したのはこれは初めてじゃないかな。医療や看護の仕事をしている人は読んでおくといいです。
 これにCDがついているのですが、これは(1)で説明した「Text Mining Studio」試供版が入っています。今はない試供版が使えるのでお得と言えばお得なのですが、機能や解析文字数が限定されているので、使いごごちはどうなんでしょうね。
 これもアマゾンでは高価格に表示されているので品切れ絶版なのでしょうね。大学の図書館だと貸出できる可能性が高いです。

(3)竹岡志朗/井上 祐輔/高木 修一/高柳 直弥(2016)
『イノベーションの普及過程の可視化―テキストマイニングを用いたクチコミ分析』
https://www.amazon.co.jp/dp/4817195916/
 丁度、修士研究が終わったころに発見して読みました。やはり、特許情報やブログのテキストで技術解析しようという主旨の著作でした。当然似たようなことを考えている人はいるわけで。著者の方々は、経営学部の先生でマーケティングにテキストマイニングを利用したいみたいですね。

(4)伊藤尚枝(2010)
『「甘えの心理」に迫る Rでテキストを分析』
https://www.amazon.co.jp/dp/4779302374/
 著者は文学作品から「甘え」を読み取るという研究をしていたようです。使っているツールは、石田さんのRmecabです。石田本の第2版が中級者向けになったので、これはRmecabの使い方を理解する上でのテキストにもなっています。Rの細かい使い方にも触れています。

(5)石田基広/金明哲(2012)
『コーパスとテキストマイニング』
https://www.amazon.co.jp/dp/4320110331/
 テキストマイニングの他にテキスト分析にはコーパスが重要な考え方になります。テキストマイニングの研究事例も書いてあるので、参考になります。買おうかどうしようか、最後まで迷ったのですが、図書館で借りてざっくり読んで済ませました。


●テキストマイニングの周辺技術について、機械学習、統計学

(6)秋光淳生(2016)
『データの分析と知識発見』
https://www.amazon.co.jp//dp/4595316364/
 放送大学の印刷教材です。実際に使ったのは改訂前の『データからの知識発見』(2012)なのですが。テキストマイニングがデータ解析の一種、Rという統計ソフトで解析できることを本書から知りました。研究計画書を書いている2014年に通読しました。すでに放送大学選科履修生だったので、講義をネットで見ることができました。何か難しい分野をやろうとしているのかな、と少し不安になりました。
 改訂前はテキストマイニングはさらっと書いているのですが、本書ではテキストマイニングの重要性も考えられ、丁寧に書いてあります。
 2014年時点では、テキストマイニングを勉強する人の必須文献とも言えます。これで学習しておくと機械学習の本もさくさく読めます。

(7)山本義郎/藤野友和/久保田貴文(2015)
『Rによるデータマイニング入門』
https://www.amazon.co.jp/dp/4274218171/
 Rの機能を簡潔に書いてある本はないかと漁っていたときに見つけました。データマイニングでRを使うならこれで十分じゃないかな。後ろの方にテキストマイニングのことも載っています。

(8)速水 悟(2016)
『事例+演習で学ぶ機械学習 ビジネスを支えるデータ活用のしくみ』
https://www.amazon.co.jp/dp/4627880219/
以前、ブログで紹介しました。
機械学習からテキストマイニングをうまくつないでいます。初心者でも読みとおせます。
http://page-only-one.cocolog-nifty.com/imotora7/2017/02/post-2b3c.html

(9)石川 慎一郎/前田 忠彦(2010)
『言語研究のための統計入門』
https://www.amazon.co.jp/dp/487424498X/
 まさしく計量言語学の本ですね。テキストマイニングのことも書いてあるんで欲しかったんですけど、結局、研究が終わってから読みました。統計学を使って、言語学にも是非切り込みたいです。CDで統計ソフトも入っています。

(10)金明哲(2009)
『テキストデータの統計科学入門』
https://www.amazon.co.jp/dp/4000057022/
テキストマイニングにどのような数学理論を使っているか説明する必要があったので、購入しました。類似の本は出ていないように思います。
金明哲さんはRを使ったデータ解析でいくつか本を書いている有名な方です。

こう見ていくとたくさんの参考資料によって研究を進めることができたのだと思います。
先達は偉大です。

私もいつか後輩に引用される書籍、論文を、という意気込みだけはあります。人気blogランキング・自然科学にぷちっとな。【押す】≪コメントは応接室にお願いします。≫

July 03, 2017

放送大学大学院『心理・教育統計法特論('15)』

統計学を勉強しているのは次の研究のためですが、差し迫った単位認定試験があります。

『心理・教育統計法特論('15)』
放送大学HP
主任講師小野寺 孝義 (広島国際大学教授)

71kcao5vql

一般書店では『新訂 心理・教育統計法特論』で売っているようです。

1 臨床心理学と統計学
【キーワード】
臨床心理学的研究、心理学におけるエビデンスに基づく実践、量的研究と質的研究、心理学と数量化、仮説生成と仮説検証、統計学

2 数学的基礎
【キーワード】
Σ、指数、対数、行列、微分・積分

3 記述統計
【キーワード】
母集団と標本、尺度水準、記述統計量、代表値、標準偏差、心理測定法、信頼性、妥当性

4 推測統計
【キーワード】
母集団推定、信頼区間、標準化、正規分布、統計的仮説検定、第1種の過誤と第2種の過誤、t検定

5 分散分析
【キーワード】
分散分析(ANOVA)、要因、水準、被験者間計画、被験者内計画、多重比較、交互作用 樫村 正美

6 相関・回帰分析
【キーワード】
散布図、共分散、偏相関、最小二乗法、回帰係数、適合度、当てはまりの悪さ

7 重回帰分析
【キーワード】
重相関係数、変数選択、決定指数、標準偏回帰係数、多重共線性

8 多変量分散分析
【キーワード】
多変量分散分析(MANOVA)、多変量正規性、分散共行列の等質性、第1種の過誤の増大、反復測定データ

9 主成分分析と因子分析
【キーワード】
合成変数、主成分、主成分負荷量、固有ベクトル、主成分得点、潜在変数、共通/独自因子、因子負荷量、単純構造、因子得点

10 共分散構造分析
【キーワード】
パス解析、因果関係、潜在変数、適合度指標

11 カテゴリカル・データの分析
【キーワード】
順序尺度、クロス表、カイ二乗検定、対数線形モデル

12 ノンパラメトリック検定
【キーワード】
ノンパラメトリック、Mann-WhitneyのU検定、メディアン検定、Wilcoxonの符号付順位和検定、Kruskal-WallisのH検定、Friedman検定

13 効果量
【キーワード】
心理統計の新しい流れ、効果量、d族の効果量、r族の効果量、信頼区間 大

14 検定力
【キーワード】
検定力、事前の検定力、事後の検定力、信頼区間

15 メタ分析
【キーワード】
文献検索、コーディング、メタ分析の効果量 大久保 街亜
-------------------------------------
心理教育統計とありますが、他の分野でも汎用性がある統計学です。さすがに大学院レベルの統計学なのでむずいです。

統計学は昔、学部で勉強したっきりやっていません。
(学部の3年に編入して過去の成績を見ることができました。確率論も統計学も単位は取得してました。)
去年、研究しながら、勉強した知識はありますが。

たぶん、教科書にすると2冊分くらいのが一冊になっているので頭痛が痛いです。
放送大学の大学院の教材は大抵そうなのですが。

いろんな統計の教科書を図書館で借りて演習問題を解いている最中です。

試験は今月、3週間前切りました。人気blogランキング・自然科学にぷちっとな。【押す】≪コメントは応接室にお願いします。≫

July 01, 2017

書談:『通勤大学 MBA 統計学』

統計学の本、4冊目です。

『通勤大学 MBA 統計学』 (通勤大学文庫)
著者:グローバルタスクフォース株式会社
Amazon

Mba_tokeigaku

【第1部】 統計学への第1歩
  第1章:統計学の概要
  第2章:分布分析の基本

【第2部】 統計学の基本知識
 第3章:データ間の関係をとらえる
  第4章:信頼性のある標本を作成する
  第5章:標本から母集団を推定する
  第6章:仮説の正しさを推定する

【第3部】 発展的内容への導入
 第7章:多次元のデータを解析する
  第8章:実践へのガイダンス

これは読んだと言っていいのかどうか。ポイントが書いてあるという点ではいいのですが、統計学の本を一冊読んでいないとわからないでしょうね。

でも高校数学の知識しかない人が読んでこれはわかるのかな。
私はある程度勉強したので、すごくよくまとまっているように思えるのですが。

まあ、私にとっては知識の確認ができてよかったです。
多変量解析のことも少し書いてあったし。

このMBAシリーズは他のも読んでいて、それなりに役立ちました。

著者はちゃんといるはずなので、「グローバルタスクフォース株式会社」でくくらないでほしいな、と思います。

去年教授に「論文読める程度に統計学は勉強しておいてね」と言われて買ってそのまま放置していた本でした。人気blogランキング・自然科学にぷちっとな。【押す】≪コメントは応接室にお願いします。≫

« June 2017 | Main | August 2017 »

サイト内検索
ココログ最強検索 by 暴想

更新情報

August 2017
Sun Mon Tue Wed Thu Fri Sat
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31