学術論文の『Results(結果)セクション』を正確に読む!数値・図表・統計表現を読み解く実践ガイド

英語の学術論文を読んでいて、「Results(結果)セクション」に差し掛かったとき、数字や統計用語が並んでいて思わず読み飛ばしてしまう——そんな経験はありませんか?じつはResultsセクションには明確な構造と読み方のルールがあります。そのルールを知っておくだけで、論文の内容把握スピードが格段に上がります。まずはResultsセクションの役割と全体像を押さえましょう。

目次

Resultsセクションの役割と構造を把握する

Resultsセクションは「事実の報告」に徹している

Resultsセクションの最大の特徴は、著者の解釈や考察を一切含まず、得られたデータをそのまま報告することに徹している点です。「なぜこの結果になったのか」「この結果が何を意味するのか」という議論はDiscussionセクションの役割であり、Resultsにはそれが登場しません。

論文を読むとき、この区別を意識していないと「著者がここで主張している」と誤読してしまうことがあります。Resultsで述べられているのはあくまで「何が観察されたか」という事実です。読む際は「これはデータの記述か、解釈か」と自問する習慣をつけましょう。

ResultsとDiscussionを混同すると、論文の主張を誤って理解する原因になります。「事実の報告」と「解釈・考察」は別物だと意識して読むことが大切です。

典型的な構成パターン:記述統計→推測統計→図表参照

Resultsセクションには、多くの論文に共通する典型的な流れがあります。この流れを把握しておくと、初めて読む論文でも迷わず内容を追えるようになります。

  • 記述統計:平均値(mean)、標準偏差(SD)、中央値(median)など、データの基本的な特徴を示す数値が最初に提示される
  • 推測統計:t検定やANOVAなどの統計的検定の結果、p値、信頼区間(CI)が続いて報告される
  • 図表参照:「as shown in Figure 1」「Table 2 presents…」のように、視覚的なデータへの誘導が行われる
Resultsセクションの3原則
  • 著者の解釈を含まず、データの事実のみを述べる
  • 記述統計→推測統計→図表参照という順序で展開される
  • Methodsで示された分析手法と1対1で対応している

MethodsセクションとResultsセクションの対応関係を意識する

Resultsを正確に読むうえで欠かせない視点が、MethodsとResultsの対応関係です。Methodsで「2群間の比較にt検定を用いた」と書かれていれば、Resultsには必ずt検定の結果が報告されています。この対応を意識することで、各数値が何を示しているのかを迷わず判断できます。

Methodsの記述Resultsで対応する内容
参加者の属性(年齢・性別など)記述統計による参加者情報の報告
2群間の比較(t検定)t値・自由度・p値・平均差の報告
複数群の比較(ANOVA)F値・p値・事後検定の結果
相関分析相関係数(r)とp値の報告
図表の種類(棒グラフ・散布図など)該当する図表番号への参照

論文を読む際は、Methodsを先に確認してから「このResultsの数値はどの分析に対応しているか」と照らし合わせる習慣をつけると、内容の理解が格段に深まります。

記述統計の英語表現を読み解く:平均・分散・分布の言葉

Resultsセクションを読むうえで最初の壁となるのが、統計略語の嵐です。Mean、SD、Median、IQR……これらの略語と、論文特有の括弧表記のルールをひとつひとつ押さえれば、数値が並ぶ文でも意味を素早くつかめるようになります。

頻出フレーズ集:Mean, SD, Median, IQRの読み方

まず、記述統計でよく使われる略語を一覧で確認しましょう。論文を読む際はこの表を手元に置いておくと便利です。

略語正式名称日本語訳意味
M または MeanMean平均値データ全体の算術平均
SDStandard Deviation標準偏差データのばらつきの大きさ
SEStandard Error標準誤差標本平均の推定精度
Mdn または MedMedian中央値データを並べたときの中央の値
IQRInterquartile Range四分位範囲第1四分位数と第3四分位数の差
CIConfidence Interval信頼区間母数が含まれると推定される範囲
n または NSample Size標本数分析に使ったデータの件数

括弧内の数値を正確に解釈する:(M = 3.2, SD = 0.8)の意味

論文では、統計値を本文中の括弧にまとめて示すのが一般的なスタイルです。括弧の中身を素早く読み取る練習をしましょう。

Participants reported moderate levels of stress (M = 3.2, SD = 0.8, n = 120).
【訳】参加者は中程度のストレスを報告した(平均 = 3.2、標準偏差 = 0.8、n = 120)。

The median score was 74 (IQR = 18), suggesting a moderately spread distribution.
【訳】中央値スコアは74(四分位範囲 = 18)であり、中程度のばらつきが示唆された。

The mean reaction time was 452 ms (95% CI [438, 466]).
【訳】平均反応時間は452ミリ秒であった(95%信頼区間 [438, 466])。

95% CI [下限, 上限] の形式は「この範囲に真の平均が95%の確率で含まれる」という意味です。角括弧内の2つの数値が区間の下限・上限を表します。

「正規分布かどうか」を示す表現に注目する

記述統計の後には、データの分布形状を説明する文が続くことがよくあります。分布の表現を読み取れると、なぜ平均ではなく中央値を使っているのかが理解できます。

  • normally distributed(正規分布に従う):平均とSDが代表値として適切
  • positively / negatively skewed(正の歪み / 負の歪み):分布が左右非対称。中央値が適切
  • outliers were detected / excluded(外れ値が検出・除外された):分析前の処理を示す
  • the distribution was approximately normal(分布はほぼ正規分布に近い):完全ではないが正規と見なせる
分布の表現で「なぜその統計値?」がわかる

論文で中央値とIQRが使われているときは、データが正規分布しない(skewed)か外れ値が多いケースがほとんどです。逆に平均とSDが使われていれば、著者はデータが正規分布に近いと判断しています。分布の記述を確認することで、統計値の選択理由まで読み取れるようになります。

統計的有意性の表現を正確に読む:p値・信頼区間・効果量

Resultsセクションの核心は「統計的有意性」の記述です。p値、信頼区間(CI)、効果量——この3つをセットで読む習慣を身につけると、著者が「どれだけ確かな結果を、どれだけの規模で得たか」を正確に把握できます。順番に見ていきましょう。

p値の読み方と「有意」を示す英語表現パターン

p値は「帰無仮説が正しいと仮定したとき、この結果が偶然生じる確率」を示します。論文では以下のような表現で登場します。

  • p < .05 / p = .03:有意。”The difference was statistically significant (p = .03).”
  • p < .01 / p < .001:より強い有意性。”highly significant” と表現されることも多い
  • ns(not significant):有意差なし。”No significant difference was found (ns).”
  • “marginally significant” / “approached significance”:p が .05〜.10 程度のグレーゾーン。著者が結果を強調したいときに使う表現で、解釈には注意が必要

信頼区間(CI)が伝えていること:幅と位置から何を読むか

信頼区間(Confidence Interval)は、真の値がおそらく含まれる範囲を示します。論文では “95% CI [0.12, 0.48]” のように括弧内に下限・上限が示されます。読むときに確認すべきポイントは2つです。

  • ゼロ(または1)をまたぐかどうか:差や比率の場合、CIがゼロをまたいでいれば「効果なし」の可能性が排除できない=統計的に非有意と一致する
  • 幅が広いか狭いか:幅が広い=サンプルサイズが小さく推定の精度が低い。幅が狭い=推定が安定している

効果量(Cohen’s d, η², r)を見て「どれくらい意味があるか」を判断する

効果量は「差や関連の大きさ」を標準化した指標です。論文では “d = 0.82” や “η² = .06” のように報告されます。以下の目安表を参照してください。

効果量指標小(Small)中(Medium)大(Large)
Cohen’s d0.20.50.8
η²(イータ二乗).01.06.14
r(相関係数).10.30.50

論文中では “a large effect size was observed (d = 0.85)” や “the effect was small (η² = .02)” のように記述されます。効果量が示されていない場合は、著者が意図的に省いている可能性もあるため注意が必要です。

「統計的有意」と「実質的意味」は別物:読み手として注意すべき落とし穴

統計的有意性の誤解に注意

サンプルサイズが非常に大きい研究では、ごくわずかな差でも p < .001 になることがあります。”statistically significant” は「偶然ではない」という意味に過ぎず、「実践的に重要」とは別の話です。p値だけでなく効果量と信頼区間を必ずセットで確認する習慣をつけましょう。

STEP
p値を確認する

p < .05 かどうかを確認し、”significant” / “ns” などの表現を読み取る。”marginally significant” のような曖昧な表現には批判的に向き合う。

STEP
信頼区間(CI)を確認する

CIがゼロをまたいでいないか、幅が広すぎないかをチェック。幅が広い場合は推定の精度が低く、結果の解釈に慎重さが求められる。

STEP
効果量を確認する

d・η²・r の値を目安表と照らし合わせ、「統計的に有意」でも効果量が小さければ実践的な意義は限定的と判断する。

図・表・グラフの英語キャプションと本文記述を読む

論文のResultsセクションでは、数値だけでなく図や表が証拠として提示されます。キャプションと本文の参照表現を正確に読む力があると、データの意味をグッと深く理解できます。順を追って読み解き方を確認しましょう。

Figure / Table のキャプションに含まれる情報を全部読む

Figureキャプションは、本文を読まなくても図単体で意味が通じるように設計されています。そのため、キャプションには「何を測定したか」「どの群を比較したか」「エラーバーの種類」「サンプル数」まで凝縮されています。まずキャプションだけを読んで図の概要を把握してから、本文の解釈に進む習慣をつけましょう。

キャプション実例と読み解きポイント

Figure 2. Mean reaction time (ms) for the control and experimental groups across three sessions. Error bars represent ±1 SD. n = 30 per group. * p < .05 vs. control.

このキャプションから読み取れること:縦軸は反応時間(ms)、2群×3セッションの比較、エラーバーはSD(標準偏差)、各群n=30、アスタリスクはコントロール群との有意差を示す。

本文中の図表参照表現:「as shown in Figure 1」「Table 2 presents…」

本文中で図表に言及する際は定型フレーズが使われます。以下の表現を覚えておくと、参照箇所をすぐに見つけられます。

英語表現意味・使われ方
as shown in Figure 1図1に示されるように(結果の根拠を指示)
as illustrated in Figure 3図3で示されているように
Table 2 presents / shows…表2は〜を示している(表を主語にした表現)
data are presented in Table 1データは表1に示す(受動態の定型表現)
see Figure 4 for details詳細は図4を参照(補足的な参照指示)

グラフの種類別・読み解きポイント:棒グラフ・折れ線・散布図・箱ひげ図

  • 棒グラフ(bar graph):各群の平均値を比較。エラーバーの種類(SD / SE / CI)に必ず注目する
  • 折れ線グラフ(line graph):時系列や条件変化のトレンドを追う。傾きの変化点に着目する
  • 散布図(scatter plot):2変数の相関関係を示す。回帰直線(regression line)の傾きと相関係数(r)を確認する
  • 箱ひげ図(box plot):中央値(median)が箱の中線、箱の上下端が第1・第3四分位数(Q1・Q3)、ひげの端が最小・最大値、点が外れ値(outlier)を示す

エラーバーと注釈記号(*, **, †)の意味を見落とさない

エラーバーの種類によって、グラフが伝える情報はまったく異なります。SDは個人差の広がり、SEは平均値の推定精度、CIは母集団の平均が含まれる範囲を示すので、キャプションで必ず確認してください。

エラーバーの種類英語表記例意味
標準偏差error bars = SDデータのばらつきの大きさ
標準誤差error bars = SEM / SE平均値の推定精度(SEはSDより小さくなる)
信頼区間error bars = 95% CI母平均が95%の確率で含まれる範囲

注釈記号はグラフ上の有意差マーカーです。一般的な対応は次のとおりです:* は p < .05、** は p < .01、*** は p < .001、† は p < .10(傾向あり)。ただし論文ごとに基準が異なる場合があるため、必ずキャプションまたはfootnoteで定義を確認する習慣をつけましょう。

注意:記号の定義は論文ごとに異なる

* や † の有意水準は論文によって異なります。「* p < .05」と定義している論文もあれば、「* p < .01」としている論文もあります。記号の意味を決めつけず、必ずその論文のキャプションや注釈欄で確認してください。

グラフ読解に必要な英語語彙チェックリスト

  • median(中央値)/ quartile(四分位数)/ interquartile range, IQR(四分位範囲)
  • outlier(外れ値)/ whisker(ひげ)/ box plot(箱ひげ図)
  • error bar(エラーバー)/ standard deviation, SD / standard error, SE / confidence interval, CI
  • regression line(回帰直線)/ correlation coefficient(相関係数)/ slope(傾き)
  • footnote(脚注)/ asterisk(アスタリスク)/ significance level(有意水準)

著者が結果をどう「見せているか」を批判的に読む

統計的な数値が正確に記述されていても、著者が「どのデータを前面に出し、どのデータを省くか」という選択自体が、読者の印象を大きく左右します。批判的読解とは論文を「疑う」技術ではなく、データを「正確に理解する」ための視点です。以下のポイントを押さえておきましょう。

数値の「選択的提示」に気づく:報告されていないデータを疑う

著者が有意な結果のみを強調し、有意でなかった変数や副次的アウトカムを本文でほとんど触れないケースがあります。サンプルサイズの変動(例:途中脱落者の扱い)や欠損データの処理方法が明示されているかを確認しましょう。”Data were excluded for…”(〜のためデータを除外した)という記述があれば、除外基準が妥当かどうかを検討することが重要です。

スケール操作・グラフの視覚的誇張を見抜くチェックポイント

グラフのy軸がゼロから始まっていない場合、わずかな差が劇的な変化のように見えます。また、グループ間でスケールが異なる複数のグラフを並べる手法も誇張につながります。キャプションと軸ラベルを必ず確認し、数値そのものと視覚的印象が一致しているかをチェックしてください。

「趨勢があった(trend toward)」など曖昧表現の読み方

“a trend toward significance (p = .08)” という表現は、統計的有意性に達しなかった結果を「惜しかった」ように見せる典型的なフレーズです。p値が閾値(通常0.05)を超えている以上、この結果は「有意でない」と解釈するのが原則です。こうした曖昧な表現を見かけたら、実際のp値と効果量を自分で確認する習慣をつけましょう。

Results内の言語的フレーミングに注目する

同じデータでも表現によって印象は大きく変わります。「20%増加した」と「5%から6%に増加した」は同じ事実ですが、受ける印象はまったく異なります。相対値(パーセント変化)は効果を大きく見せやすく、絶対値はより実態に近い情報を伝えます。著者がどちらの表現を選んでいるかに意識を向けましょう。

比較例:同じデータ、異なる表現

【相対値表現】”The treatment group showed a 20% increase in recovery rate.”(回復率が20%増加した)

【絶対値表現】”The recovery rate increased from 5% to 6%.”(回復率が5%から6%に増加した)

どちらも正確な記述ですが、前者は効果を大きく印象づけます。両方の表現が記載されているかを確認しましょう。

Resultsを批判的に読む際の確認チェックリスト

  • サンプルサイズの変動(脱落・除外)が明示されているか
  • グラフのy軸はゼロから始まっているか、スケールは均等か
  • “trend toward significance” など曖昧表現の実際のp値を確認したか
  • 相対値だけでなく絶対値も報告されているか
  • 有意でなかった結果や副次アウトカムも公平に報告されているか
批判的読解の目的と姿勢

批判的読解は「著者を攻撃する」ためのものではありません。著者の表現の選択を意識することで、データが本当に示している事実を正確に把握するための技術です。疑問を持ちながら読むことが、論文リテラシーを高める最短ルートです。

実践演習:Resultsセクションの英文を丸ごと読んでみよう

ここまで学んだ数値・統計・図表の読み方を、実際の英文で試してみましょう。「読める気がする」から「実際に読める」に変わるのは、手を動かす演習があってこそです。量的研究と質的研究、2つのサンプルで練習します。

演習用サンプル文(量的研究・質的研究それぞれの例)

サンプルA:量的研究(統計検定あり)

Participants in the intervention group showed significantly greater improvement in vocabulary scores than those in the control group (M = 14.3 vs. M = 9.1; t(58) = 3.42, p = .001, d = 0.87, 95% CI [2.1, 8.3]). As shown in Figure 2, score gains were consistent across all proficiency subgroups.

サンプルB:質的研究(頻度・割合の記述)

Of the 40 participants interviewed, 32 (80%) reported increased motivation following the program. Three recurring themes emerged from the data: autonomy, relevance, and peer support. Autonomy was mentioned most frequently, appearing in 27 of 40 responses (67.5%).

ステップ別読解ウォークスルー:数値・統計・図表参照を順番に処理する

STEP
中心的な数値を拾う

サンプルAでは、介入群の平均14.3と対照群の平均9.1を確認します。差は約5.2点です。サンプルBでは「80%」「67.5%」という割合と、その母数(40人)を押さえます。

STEP
統計表現を解釈する

サンプルAの「p = .001」は有意差あり、「d = 0.87」は効果量が大きいことを示します。「95% CI [2.1, 8.3]」はゼロをまたいでいないため、信頼区間の観点からも差が支持されます。

STEP
図表参照を本文と照合する

「As shown in Figure 2」とあれば、Figure 2のキャプションと照合して「サブグループ全体で一貫した改善」が視覚的に示されているか確認します。本文の主張と図が一致しているかをチェックしましょう。

STEP
「わかること・わからないこと」を整理する
  • わかること:介入群の語彙スコアが有意かつ実質的に向上した
  • わからないこと:長期的な効果の持続性、他のスキルへの影響

よくある読み間違いパターンとその修正

以下の誤読パターンは非常によく見られます。自分が同じ誤りをしていないか確認してください。

誤読パターン正しい解釈
「p = .001だから効果が大きい」p値は効果の大きさではなく有意性の指標。効果量(d = 0.87)を別途確認する
「CIが示されているから十分」CIの幅が広い場合は推定の精度が低い。[2.1, 8.3]は幅6.2あり、解釈に注意が必要
「80%が動機向上→全員に効果あり」残り20%(8人)への効果は不明。質的研究では多数派の傾向として読む
「Figure 2を見なくていい」本文の主張を図で検証するのが批判的読解の基本。必ず照合する
読解完了チェックリスト
  • 平均値・割合など中心的な数値を確認した
  • p値と効果量を区別して解釈した
  • 信頼区間の幅とゼロをまたぐかどうかを確認した
  • 本文の図表参照と実際の図を照合した
  • 「このResultsから何がわかり、何がわからないか」を自分の言葉でまとめた

よくある質問(FAQ)

Resultsセクションを読むとき、MethodsとDiscussionも同時に読む必要がありますか?

必須ではありませんが、Methodsを先に確認しておくと各数値が何の分析に対応しているかがすぐにわかります。Discussionは著者の解釈が書かれているセクションなので、Resultsを読んだ後に参照すると「データの事実」と「著者の解釈」を区別しながら読み進められます。

p値が示されていない論文はどう読めばよいですか?

分野によっては効果量や信頼区間のみを報告し、p値を省略する論文もあります。その場合は信頼区間がゼロをまたいでいるかどうかと、効果量の大きさを中心に判断してください。また、ベイズ統計を用いた論文ではBayes Factor(BF)が代わりに報告されることがあります。

統計の知識がほとんどない場合、Resultsセクションはどこから読み始めればよいですか?

まずは図表のキャプションから読み始めるのがおすすめです。キャプションは図単体で意味が通じるように書かれているため、統計の詳細を理解していなくても「何を比較しているか」「どちらが高いか」といった大まかな傾向をつかめます。その後、本文の数値と照らし合わせながら少しずつ統計表現に慣れていきましょう。

「significant」という単語が出てきたら、必ず統計的有意性を指しているのですか?

文脈によります。”statistically significant” や “p < .05” と組み合わせて使われていれば統計的有意性を指しますが、”clinically significant”(臨床的に重要)や “practically significant”(実践的に意味がある)のように修飾語が付く場合は別の意味になります。”significant” 単体で使われている場合は前後の文脈を必ず確認してください。

効果量が報告されていない論文は信頼性が低いのですか?

効果量の報告は分野や雑誌の慣習によって異なるため、報告がないこと自体が信頼性の低さを意味するわけではありません。ただし、効果量がないとp値だけで結果の実質的な意味を判断しなければならず、読み手にとって不便です。効果量が示されていない場合は、平均値の差とSDから自分でCohen’s dを概算するか、サンプルサイズを考慮しながら慎重に解釈することをおすすめします。

目次