病気は、臓器群の変調という現象として現れますが、その背景には生命の設計図とも呼ばれるゲノムがあり、オミクスとよばれるエピゲノム・RNA・タンパク質など多彩な分子が細胞を制御・構成しています。また、細胞には環境や加齢により長い時間をかけて変化していく個々人で異なる細胞コンテクストがあり、そのもとで機能している臓器の状態も多様です。さらに、一生変わらないとされていたゲノムも、造血幹細胞には加齢とともにゲノム変異が着実に蓄積していっていることが報告されています。また、さまざまな環境要因の影響を受けながら長い生体時空間的プロセスの中で生じるがんは、ヒトが生れたときからそのプロセスが始まっているといっても過言ではありません。個々人の多様性だけでなく、個人の一生にも多様性があります。これが、科学が明らかにした高齢化社会の現実といえます。
一方、ゲノムシーケンス技術の革新は、エピゲノム・RNAデータを含め、既にペタバイト単位の量のデータを生み出しています。画像や生理データなどを含む高精度臨床データも大規模に蓄積されています。2006年に始まったグランドチャレンジプログラム、続く戦略分野プログラムでは、「京」をフルに動かせる心臓シミュレータUT-Heartを初めとする世界最高レベルのシミュレーション技術を開発しました。また、全遺伝子やノンコーディングRNAを対象とした大規模生命データ解析技術の開発により、数十テラバイト規模のデータに対応できるまでになり、「京」を使って初めて可能になったがん生物学上の発見や予測法の開発などがありました。しかし、UT-Heartによるサルコメアから血液駆出まで1.5心拍のマルチスケールシミュレーションは極めて画期的成果ですが、ほぼ全「京」を用いて17時間の連続稼働が必要でした。がん研究では、国際連携により主な約50種のがん種などについて5%程度の頻度の主要な変異が、総計で「京」程度の計算能力を合わせることで同定されています。しかし、「個々人のがん」を捉えるには全ゲノム解析に基づき、1%以下の頻度の変異を網羅的に見いだすことが必須であり、「京」では5000日を要してしまいます。上に述べましたようにヒトの多様性がさまざまな観点から明らかになる中、大規模な画像や生理データ、さらには健康情報やゲノム情報と個々人の病態の分子メカニズムとの乖離を埋める技術が不可欠となっています。