<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
		xmlns:xhtml="http://www.w3.org/1999/xhtml"
>

<channel>
	<title>Silicon Soul  -広告技術と広告のblog- &#187; ネタ</title>
	<atom:link href="http://siliconsoul.net/tag/%e3%83%8d%e3%82%bf/feed/" rel="self" type="application/rss+xml" />
	<link>http://siliconsoul.net</link>
	<description></description>
	<lastBuildDate>Sat, 03 Oct 2009 15:34:36 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.3</generator>
<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://siliconsoul.net/tag/%e3%83%8d%e3%82%bf/feed/" />
		<item>
		<title>政策別に各政党のマニフェストをテキストマイニング</title>
		<link>http://siliconsoul.net/2009/08/26/%e6%94%bf%e7%ad%96%e5%88%a5%e3%81%ab%e5%90%84%e6%94%bf%e5%85%9a%e3%81%ae%e3%83%9e%e3%83%8b%e3%83%95%e3%82%a7%e3%82%b9%e3%83%88%e3%82%92%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%83%9e%e3%82%a4%e3%83%8b/</link>
		<comments>http://siliconsoul.net/2009/08/26/%e6%94%bf%e7%ad%96%e5%88%a5%e3%81%ab%e5%90%84%e6%94%bf%e5%85%9a%e3%81%ae%e3%83%9e%e3%83%8b%e3%83%95%e3%82%a7%e3%82%b9%e3%83%88%e3%82%92%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%83%9e%e3%82%a4%e3%83%8b/#comments</comments>
		<pubDate>Tue, 25 Aug 2009 19:28:23 +0000</pubDate>
		<dc:creator>silicon_soul</dc:creator>
				<category><![CDATA[プログラミング]]></category>
		<category><![CDATA[ネタ]]></category>
		<category><![CDATA[マニフェスト]]></category>
		<category><![CDATA[多次元尺度法]]></category>
		<category><![CDATA[選挙]]></category>

		<guid isPermaLink="false">http://siliconsoul.sakura.ne.jp/wp/?p=384</guid>
		<description><![CDATA[前回に引き続き、マニフェストのテキストマイニングで遊んでみます。 今回は２相３元データに対する多次元尺度構成法という、あまり一般的でない解析手法を適用します。 多次元尺度構成法（多次元尺度法）とは。　たとえば、世界の都市 [...]]]></description>
			<content:encoded><![CDATA[<p>前回に引き続き、マニフェストのテキストマイニングで遊んでみます。</p>
<p>今回は２相３元データに対する多次元尺度構成法という、あまり一般的でない解析手法を適用します。</p>
<p>多次元尺度構成法（多次元尺度法）とは。　たとえば、世界の都市を飛行機で移動するときの時間の情報だけをもとに、移動時間の短い都市同士を近くに、移動時間が長い都市は遠くに配置して移動時間ベースの地図をつくることができる方法で、各点間の距離や類似度の情報をもとに、各ポイントの位置を空間にプロットすることができます。簡単にいうとこんなところです。各都市のイメージの類似度をもとにバカ世界地図を構成するのにも似てなくも無いです。</p>
<p>　個人差多次元尺度法(Weighted MDS)と呼ばれる方法は、この多次元尺度法を個人間のイメージの違いも同時に分析できるようにした手法で、心理学関連の研究で使われています。w-mdsが各個人間の評価の違いをどう表現するのかというと、全員の共通項となる地図（共通布置空間）を１つ作り、各個人の差を、軸（緯度、経度）へのweightとして表現します。ある人にとっての地図は、共通項となる地図を緯度方向にちょっとだけ縮めたもので、ある人にとっての地図は経度方向に縮尺するとうまく当てはまる。みたいな。</p>
<p>説明むずかしいな。。。詳細はぐぐってください。<br />
　<br />
で、マニフェストにwmdsを適用して解析して、各政策別に政党間類似具合がうまく見えたら面白いなぁと。</p>
<p>wmdsの解析は、netlibで手に入るsindscalを使いました。<br />
<a href="http://www.netlib.org/mds/">netlib/sindscal</a>　<br />
Fortranのソースですので、g77あたりでコンパイルできます。</p>
<p>※indscal/sindcalをより一般化したALSCALがGNU Rで使えたような気がするのですが、どのパッケージに含まれているかみつからなかったのでsindscalで解析しています。<br />
　<br />
　<br />
では、プロセスです<br />
１．類似度行列の算出<br />
各党のマニフェストを前回同様ヤフーみんなの政治からこぴってきます。<br />
各政策単位のマニフェストデータを各党ごとにコサイン類似度をとり、行列を作成し、<br />
sindscalのデータフォーマットにおとしこみます。<br />
２．sindscalで解析<br />
コンパイルしたプログラムをsindscalのプログラムに標準入力から渡して解析修了です。<br />
これで政党の共通布置空間と各政策の傾向を表すWeightを得ることができます。<br />
３．GNU Rで作図<br />
GNU Rにデータを引っ張って作図します。</p>
<p>sindscalのデータフォーマットは<a href="http://www.amazon.co.jp/gp/product/0126243506?ie=UTF8&#038;tag=silicon_soul-22&#038;linkCode=as2&#038;camp=247&#038;creative=1211&#038;creativeASIN=0126243506">Introduction to Multidimensional Scaling</a><img src="http://www.assoc-amazon.jp/e/ir?t=silicon_soul-22&#038;l=as2&#038;o=9&#038;a=0126243506" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" />か、<a href="http://www.amazon.co.jp/gp/product/0803930682?ie=UTF8&#038;tag=silicon_soul-22&#038;linkCode=as2&#038;camp=247&#038;creative=1211&#038;creativeASIN=0803930682">Three Way Scaling</a><img src="http://www.assoc-amazon.jp/e/ir?t=silicon_soul-22&#038;l=as2&#038;o=9&#038;a=0803930682" width="1" height="1" border="0" alt="" style="border:none !important; margin:0px !important;" />　という本に載っています。　Web上ではみあたらないので、欲しい方がいたら詳細upします。<br />
　<br />
　<br />
結果です。<br />
　VAF比の動きをみると5次くらいまでのデータを見たほうがよさそうなんですが、視覚化できないので２次までを求めました。</p>
<p>sindscalの解析結果は次のように出てきます。<br />
<div id="attachment_369" class="wp-caption aligncenter" style="width: 220px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/output.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/output-210x300.png" alt="sindscal output" title="output" width="210" height="300" class="size-medium wp-image-369" /></a><p class="wp-caption-text">sindscal output</p></div><br />
<div id="attachment_370" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/weight_space.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/weight_space-300x292.png" alt="weight_space" title="weight_space" width="300" height="292" class="size-medium wp-image-370" /></a><p class="wp-caption-text">weight_space</p></div><br />
　<br />
　<br />
　この解析は、各党の”主張”が似ているかどうかを算出しているわけではなく、各党で”似たような単語”が使われているかどうかによって空間配置を行っているという点にご注意ください。<br />
　<br />
　<br />
　<br />
まず、共通布置空間(STIMULUS MATRIX)とWeight MatrixをPlotします。<br />
　</p>
<p><div id="attachment_411" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/stimulus1.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/stimulus1-300x238.png" alt="stimulus matrix" title="stimulus" width="300" height="238" class="size-medium wp-image-411" /></a><p class="wp-caption-text">stimulus matrix</p></div><br />
<div id="attachment_412" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/weight1.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/weight1-300x243.png" alt="Weight matrix" title="Weight matrix" width="300" height="243" class="size-medium wp-image-412" /></a><p class="wp-caption-text">Weight matrix</p></div><br />
　<br />
　Stimulus spaceが全体的な傾向の布置になり、自民・改革クラブ、社民・共産・民主党が近い距離にプロットされています。前回のクラスタ分析・MDSの結果とは若干違う傾向がでてますが、新党日本の位置はかわらないようです。<br />
　<br />
　Weight matrixは各政策に対し、各党ごとに特徴が出ているかどうかといった事をあらわしています。特に子育てに関する政策に関しては差が顕著に出ています。<br />
　<br />
　</p>
<p>次に、各政党の共通布置空間に、政策別のWeightをかけた政策の個別空間をつくっていきます。<br />
　<br />
　<br />
　<span id="more-384"></span><br />
<div id="attachment_413" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5ad90e882b2e381a61.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5ad90e882b2e381a61-300x246.png" alt="子育て・教育" title="子育て・教育" width="300" height="246" class="size-medium wp-image-413" /></a><p class="wp-caption-text">子育て・教育</p></div><br />
　<br />
差が顕著にでている子育て政策ですが、y軸のばらつきに変化は少なくｘ軸方向につぶれたグラフになっています。自民⇔新党日本の差はすくなくなっていますが、社民⇔自民間の差は大きいようです。<br />
　<br />
　<br />
　<div id="attachment_414" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5b9b4e987911.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5b9b4e987911-300x235.png" alt="年金制度" title="年金制度" width="300" height="235" class="size-medium wp-image-414" /></a><p class="wp-caption-text">年金制度</p></div><br />
　<br />
　<br />
年金制度に関して、共通布置に近く、共通布置と同様の傾向なのではないでしょうか。<br />
　<br />
　<br />
　<br />
<div id="attachment_415" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e59cb0e696b9e58886e6a8a92.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e59cb0e696b9e58886e6a8a92-300x240.png" alt="地方分権" title="地方分権" width="300" height="240" class="size-medium wp-image-415" /></a><p class="wp-caption-text">地方分権</p></div><br />
これも固有の特徴がみられません。<br />
　</p>
<p><div id="attachment_418" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e694bfe6b2bb2.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e694bfe6b2bb2-300x248.png" alt="政治・行政改革" title="政治・行政改革" width="300" height="248" class="size-medium wp-image-418" /></a><p class="wp-caption-text">政治・行政改革</p></div><br />
y軸方向に圧縮された感じの布置で、保守、リベラルの違いのようなものがあまり見られないような布置ができあがりました。<br />
　<br />
　<br />
　<br />
<div id="attachment_419" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5ae89e4bf9d1.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e5ae89e4bf9d1-300x239.png" alt="安保" title="安保" width="300" height="239" class="size-medium wp-image-419" /></a><p class="wp-caption-text">安保</p></div><br />
安保。政治・行革と同様の傾向でしょうか。</p>
<p>　<br />
　<br />
　</p>
<p><div id="attachment_420" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e8beb2e6a5ad1.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e8beb2e6a5ad1-300x238.png" alt="農業" title="農業" width="300" height="238" class="size-medium wp-image-420" /></a><p class="wp-caption-text">農業</p></div><br />
農業政策は共通布置にちかいですね。<br />
　<br />
　<br />
　</p>
<p><div id="attachment_421" class="wp-caption aligncenter" style="width: 310px"><a href="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e8b2a1e6ba901.png"><img src="http://siliconsoul.sakura.ne.jp/wp/wp-content/uploads/2009/08/e8b2a1e6ba901-300x240.png" alt="消費税・財源" title="消費税・財源" width="300" height="240" class="size-medium wp-image-421" /></a><p class="wp-caption-text">消費税・財源</p></div><br />
財源・消費税。政治・行革政策の傾向に近く、保守< ->リベラル間の差がすくない印象です。<br />
　<br />
　<br />
　<br />
　<br />
　<br />
　<br />
　<br />
以上、各党のマニフェストのデータをもとに、計量的に各政策の違いをみてみました。当初想定していたより”差”がでておらず、解析結果をどう読んでいいのか良くわからないところが多かったのですが、次元をあげればもうちょっと面白い結果が見れるかもしれません。<br />
　<br />
　<br />
　<br />
　</p>
]]></content:encoded>
			<wfw:commentRss>http://siliconsoul.net/2009/08/26/%e6%94%bf%e7%ad%96%e5%88%a5%e3%81%ab%e5%90%84%e6%94%bf%e5%85%9a%e3%81%ae%e3%83%9e%e3%83%8b%e3%83%95%e3%82%a7%e3%82%b9%e3%83%88%e3%82%92%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%83%9e%e3%82%a4%e3%83%8b/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://siliconsoul.net/2009/08/26/%e6%94%bf%e7%ad%96%e5%88%a5%e3%81%ab%e5%90%84%e6%94%bf%e5%85%9a%e3%81%ae%e3%83%9e%e3%83%8b%e3%83%95%e3%82%a7%e3%82%b9%e3%83%88%e3%82%92%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%83%9e%e3%82%a4%e3%83%8b/" />
	</item>
	</channel>
</rss>

