ガーミンVivosmart5対アップルウォッチ生体計測データ比較レビュー
この記事は約 10 分で読めます
このシリーズではスマートウォッチやスマートリングの健康管理・生体データ計測機能をレビューしています。
この記事では Garmin Vivosmart 5 とアップルウォッチを比較します。
結論は、アップルウォッチの方が全体的に信頼性が高かったといえるでしょう。
歩数計測は両デバイスとも高い一致性を示しました。呼吸数と血中酸素の計測ではガーミンはアップルウォッチに比べて低い値を示しました。逆に最大酸素摂取量についてガーミンはアップルウォッチより高めの値となりました。
統計解析も含めた詳しい比較結果をすべて公開します。
結果を知りたい人はまとめをお読みください。
レビュー方法
デバイスの装着と計測時間
上図に示すイメージでレビューを行いました。
左腕に Apple Watch (Series 8) と Garmin Vivosmart 5 を両方装着しました。左手は私にとって非利き手です。
日中、夜間を通して装着しデータを取り続けました。例外としてシャワー中のバッテリー充電 (18:00 – 20:00), 毎朝の体重計測時など一部非計測の時間帯があります。
計 1 か月間 (31 日間) データをとりました。
比較項目とデータ解析ツール
メーカーのアプリを使ってまずは基礎データを集計します。そして私の個人 PC にデータを手動でダウンロードしてさらに細かく分析します。
比較する項目は下記のとおりです。
- 歩数 (Steps)
- 安静時心拍数 (RHR: Resting Heart Rate)
- 心拍変動 (HRV: Heart Rate Variability)
- 呼吸数 (Respiratory Rate)
- 血中酸素 (Oxygen Saturation, SpO2)
- 皮膚温 (Skin Temperature)
- 最大酸素摂取量 (VO2 Max)
外部リンク:ヘルスサイエンス | Garmin (各計測項目の正常範囲などを参考)
ガーミンは心拍変動と皮膚温を計測することができません。そのため今回の比較の対象外です。
分析のメインは折れ線グラフによる日々の傾向比較です。両デバイスが同じ傾向で計測できているか確認します。
同じ傾向かどうか、統計的には正の相関があるかどうかで判断できそうです。そのため相関係数 R も計算します。
一部の項目は t 検定による平均値の比較も行います。
この記事は論文ではないので本格的な統計処理はやりません。しかし簡易分析でも「両デバイスに有意な(計測の)差があるか」、「日々の計測が安定しているかどうか」といったことが t 検定でわかります。
どちらの計測精度が良いか、といった評価ではなく製品ごとのクセを明確にしたいと思います。
計測精度の観点でいえば、アップルウォッチの精度は良いはずです。アップルウォッチは医療機器認証(心電図のみ)を取得しています。
データの扱い方や解析の補足説明についてはまとめページの項目を参照願います。
グラフによる傾向比較結果
歩数
上図は歩数の比較結果です。
アップルの点とガーミンの点にわずかなずれはあるものの、同じような計測結果になっています。
相関係数 R = 0.997 で最高レベルの正の相関です。 Fitbit Charge 5 以上の結果でした。
両デバイスともに歩数は同じように計測しているといえます。
安静時心拍数
上図は安静時心拍数の比較結果です。
ガーミンの方が明らかに低い値となっています。安静中で 50 台はかなり低いですね。
相関係数 R = 0.328 で弱い正の相関があります。グラフをぱっと見て同じ傾向を示しているとは思えませんが。
ガーミンのアプリを見て観察したところ、安静時心拍数は睡眠中の値を採用していそうです。オーラリングと似ています。
ただし、オーラリングは睡眠中の最低心拍数でした。ガーミンは最低心拍数をそのまま採用しておらず、睡眠中のどこかといった感じです。平均値でもなさそうです。
一方、アップルウォッチは日中のどこかの値です。一日に何度も値が更新されますが、寝ている間の値は採用されません。
起床中と睡眠中の値を使っているので違う結果となるのはある意味当然でしょう。
呼吸数
上図は呼吸数の比較結果です。
ガーミンの値が明らかに低いです。すべての計測結果が 12 から 14 BrPM の間でした。ただ最低でも 12 以上なので睡眠時無呼吸症候群の疑いはなさそうです。
相関係数 R = 0.465 は弱い正の相関が認められます。それなり同じ傾向を示そうとしています。
では両デバイスの違いはどのように出たのでしょうか?
上図はある夜の呼吸数の比較結果です。
同じ時間帯で比較すると、アップルウォッチの計測範囲は 12.5 – 19.5 (BrPM), ガーミンの計測範囲は 10 -15 (BrPM)でした。
ガーミンは平均値を出す元の値ですらアップルウォッチより低い傾向にありました。
使っている心拍センサーの違いが今回の結果の違いになった可能性が高いでしょう。
血中酸素
上図は血中酸素の比較結果です。
ガーミンの計測値がアップルウォッチよりも明らかに低いです。
相関係数 R = 0.006 も全く相関しているとはいえない値です。
つまりアップルウォッチとガーミンで同じような傾向で計測していないということになります。
上図はある夜の血中酸素の比較結果です。
血中酸素は呼吸数と同じようにサンプリングに違いがあります。アップルウォッチ 1 時間に数回計測、ガーミンは毎分計測です。
アップルウォッチの計測範囲は 88 – 100 %, ガーミンの計測範囲は 83 – 100 % でした。ただしガーミンは計測できていない時間帯がありますね。
最低値も比較すると結果が違うのがわかります。アップルウォッチが計測した最低値は 88 %, 時間帯は 0 時台でした。一方ガーミンは最低値 83 %, 時間帯は 3 時台でした。
血中酸素を同じように計測しているとはとても思えません。
相関係数は夜間の計測結果の平均値の比較ですが、相関なしという結果は平均値比較以前の問題ですね。
最大酸素摂取量
上図は最大酸素摂取量 (VO2 Max) の比較結果です。
Apple (Measured) はワークアウトで計測した結果、 Apple (Estimated) は安静時心拍数から推定した値です。同じく Garmin (Measured) は計測値、 Garmin (Estimated) は安静時心拍数から推定した値です。
ガーミンの方は何度マニュアル計測しても値が出ずに終わってしまい 31 日間のうち 2 点しかありません。どちらも 42 (mL/kg/min) でした。
一方、アップルウォッチの計測値は 30 台後半でした。アップルウォッチはワークアウトを設定すれば 10 分程度の徒歩でも最大酸素摂取量の値を計算してくれます。
推定値同士の相関係数 R = 0.287 と相関しているかどうか微妙な結果でした。
ガーミンの計測値、推定値どちらもアップルウォッチの計測値より高いです。ガーミンに限らずアップルウォッチ以外の製品は基本的にどれも 40 以上の値を出します。
VO2 Max が 40 以上という結果が正しければ、 40 代の私にとっては平均以上の値で心拍機能が比較的良いことになります。その結果は嬉しいですがやはり正しく計測・推定しているのか?と疑ってしまいます。
アップルウォッチの計測結果が一番実態を表しているといえます。
統計処理の結果
難しい話になるので結果だけ知りたい人はここを飛ばして最後の「まとめ」をお読みください。
歩数
上図は歩数の t 検定の結果です。上図は箱ひげ図と呼ばれています。
黒いダイアモンド型の点は外れ値と呼ばれます。平均から外れている値です。アップルウォッチ、ガーミンともに外れ値が 2 個、箱の上側に出ています。
どちらも 2 万歩以上の値です。旅行先で歩いたのがこのように外れ値判定されました。確かに自宅でデスクワークしている日と比べたら 2 万歩は異常ですね。
平均値に統計的な差はありませんでした。傾向分析でほぼ一致した計測結果となっているので平均値もほぼ同じ値となっています。
歩数についてはアップルウォッチとガーミンで同じように計測しているといえます。
安静時心拍数
上図は安静時心拍数の t 検定の結果です。
統計的に有意差があるという結果がハッキリでました。両デバイスの平均値には統計的な違いがあります。 p < 0.001 という結果は乱暴に言えば「この差が偶然起きた確率は 0.1 % 未満」です。
ガーミンの平均値はアップルウォッチより低いです。
アップルウォッチは日中の安静時心拍数、ガーミンは睡眠中の安静時心拍数、この違いが平均値の違いでしょう。一般的に睡眠中の方が心拍数は下がります。
ただしアップルウォッチは外れ値があります。上と下の両方にありますね。
ストレスを抱えて仕事をしたり、休日でリラックスしていたことがこのような結果になっているのでしょうか?
呼吸数
上図は呼吸数の t 検定の結果です。
統計的に有意差があるという結果がハッキリでました。両デバイスの平均値には統計的な違いがあります。 p < 0.001 という結果は乱暴に言えば「この差が偶然起きた確率は 0.1 % 未満」です。
ガーミンのグラフは箱ひげ図ではなく「線」になっています。なぜでしょうか?
傾向のグラフを見ると、ガーミンの計測値のほとんどが 13 BrPM です。同じ値ばかりなので幅を持たせることができず線になっています。
そして 12, 14 BrPM の値が外れ値となっています。 1 BrPM 違うだけで外れ値判定は厳しすぎるでしょう。
一方アップルウォッチは平均値がガーミンより高くかつ幅があります。
どちらのデバイスを信頼したいか?と聞かれれば「アップルウォッチ」と答えたくなります。
血中酸素
上図は血中酸素の t 検定の結果です。
統計的に有意差があるという結果がハッキリでました。両デバイスの平均値には統計的な違いがあります。 p < 0.001 という結果は乱暴に言えば「この差が偶然起きた確率は 0.1 % 未満」です。
ガーミンの平均値はアップルウォッチより低い。そのことは傾向分析でも指摘されました。そもそも生の計測値ですらアップルウォッチより低い結果でした。
アップルウォッチの方が信頼できそうです。
まとめ
Garmin は VO2 Max が計測できるトラッカーの先駆けだったと記憶しています。 GPS も含めて計測技術に強みがあると思っていました。
しかし今回のレビューを通じて生体データの計測については改善が必要だということがわかりました。
ガーミン Vivosmart 5 は心拍変動と皮膚温が計測できません。また他の項目も最大酸素摂取量以外はアップルウォッチよりも低めの計測結果となりました。
この記事をまとめましょう。
- 歩数:日々の傾向について非常に高い正の相関が見られ、計測結果はほぼ一致していた。また t 検定による平均値の比較でも両デバイス間に統計的な差異は見られず、どちらも同じように歩数を計測していた。
- 安静時心拍数:両デバイスの計測結果には弱い正の相関が見られただけでなく、統計的な有意差も見られた。この違いはアップルウォッチが日中の値、ガーミンが睡眠中の値を採用しているためであった。結果としてガーミンの平均値はアップルウォッチよりも低くなっていた。
- 呼吸数:ガーミンはアップルウォッチよりも低い値を示し、計測範囲も狭かった。平均値の比較でも統計的な有意差が見られた。この違いは使用されている心拍センサーの差異による可能性がある。
- 血中酸素:ガーミンはアップルウォッチよりも明らかに低い値を示し、両デバイス間での相関性はほとんど見られなかった。また平均値においても統計的な有意差が見られた。アップルウォッチの方が信頼できそう。
- 最大酸素摂取量:計測結果には明確な差が見られた。ガーミンはアップルウォッチよりも高い値を示したが、そもそもきちんと計測できず全体の傾向を確認することは難しかった。一方でアップルウォッチの計測値は安定しており実態をより良く表していた。
関連記事:Garmin Vivosmart 5 vs Fitbit「睡眠の質」表示比較レビュー
まとめページ【おすすめ】各社ヘルストラッカーの健康管理機能をレビュー【比較】に戻る
※このレビューは 2023 年 5 月に行いました。最新ソフトではこの記事で書かれた内容と相違があるかもしれません。
※このレビューではアプリは iPhone 版を主に使用しました。 Android 版でも大きな違いはないと想定してレビューしました。
※レビュー時点での Garmin Vivosmart 5 Firmware Version: 2.94
※この記事のデータ測定結果は診断結果ではありません。データを過信せず不調を感じた際にはかかりつけ医に相談してください。