Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Quantum-enhanced Markov chain Monte Carlo

タグ: algorithm sample-based

このチュートリアルでは、Qamomileを使ってQuantum-enhanced Markov chain Monte Carlo (QeMCMC) Layden et al. (2023) を実装する例を示します。

# 最新のQamomileをpipからインストールします!
# !pip install qamomile

背景

ボルツマン分布のサンプリング

多くの物理・工学的な問題では、ある確率分布μ(x)\mu(\bm{x})からサンプルx\bm{x}を得ることが重要な計算タスクになります。代表的な例が、統計力学におけるボルツマン分布です:

μ(x)=1Zexp(βE(x)),Z=xexp(βE(x)).\mu(\bm{x}) = \frac{1}{Z} \exp\bigl(-\beta E(\bm{x})\bigr), \quad Z = \sum_{\bm{x}} \exp\bigl(-\beta E(\bm{x})\bigr).

ここで、E(x)E(\bm{x})は状態x\bm{x}のエネルギー、β=1/T\beta = 1/Tは逆温度、ZZは分配関数と呼ばれる規格化定数です。 ボルツマン分布は熱平衡状態における状態x\bm{x}の確率分布を与えるだけでなく、これを目標分布とするサンプリングは組合せ最適化問題の解法としても広く利用されています。

ボルツマン分布のエネルギー関数の具体例として、イジング模型を考えてみましょう。イジング模型は、各サイトiiにスピン変数xi{1,+1}x_i \in \{-1, +1\}が置かれた系で、そのエネルギーは次式で与えられます:

E(x)=i,jJijxixjihixi.E(\bm{x}) = -\sum_{\langle i, j \rangle} J_{ij} \, x_i x_j - \sum_i h_i \, x_i.

ここで、JijJ_{ij}はスピン間の相互作用、hih_iはサイトiiにかかる外部磁場です。状態の総数は2n2^nと指数的に増えるため、nnが大きい場合には分配関数ZZを厳密に計算することは困難です。そこで、μ(x)\mu(\bm{x})から直接サンプルを得る手法として、後述するMCMCが利用されます。

まずは、小さなイジング模型について実際にボルツマン分布を可視化してみましょう。ここでは、1次元強磁性イジング鎖(Ji,i+1=1J_{i,i+1} = 1hi=0h_i = 0)を考え、逆温度β\betaを変えながら、エネルギーE(x)E(\bm{x})ごとの確率を集計したヒストグラムをプロットします。

import os
from typing import Any, Callable

import matplotlib.pyplot as plt
import numpy as np

docs_test_mode = os.environ.get("QAMOMILE_DOCS_TEST") == "1"

n_spins = 6
J = 1.0


def ising_energy(state: np.ndarray) -> float:
    """スピン配置``state``の1次元強磁性イジング鎖のエネルギーを返す(外部磁場なし)。"""
    return -J * np.sum(state[:-1] * state[1:])


# 2^n すべての状態を列挙
all_states = np.array(
    [[1 - 2 * ((k >> i) & 1) for i in range(n_spins)] for k in range(2**n_spins)]
)
energies = np.array([ising_energy(s) for s in all_states])
# n_spins サイト上の 2^n 通りのスピン配置、エネルギーは強磁性 / 反強磁性の
# 両極端 +/- (n - 1) * J に挟まれる。
assert all_states.shape == (2**n_spins, n_spins)
assert energies.shape == (2**n_spins,)
assert energies.min() == -(n_spins - 1) * J
assert energies.max() == (n_spins - 1) * J

# エネルギーごとにボルツマン分布を集計してヒストグラムとしてプロット
unique_energies = np.unique(energies)
betas = [0.5, 1.0, 2.0]

fig, axes = plt.subplots(1, len(betas), figsize=(12, 3.5), sharey=True)
for ax, beta in zip(axes, betas):
    weights = np.exp(-beta * energies)
    probs = weights / weights.sum()
    e_probs = np.array([probs[energies == e].sum() for e in unique_energies])
    ax.bar(unique_energies, e_probs, width=0.8)
    ax.set_xlabel(r"Energy $E(\mathbf{x})$")
    ax.set_title(rf"$\beta = {beta}$")
axes[0].set_ylabel(r"Probability $\mu(E)$")
fig.suptitle(f"Boltzmann distribution of {n_spins}-spin Ising chain")
plt.tight_layout()
plt.show()
<Figure size 1200x350 with 3 Axes>

マルコフ連鎖モンテカルロ法 (MCMC)

マルコフ連鎖モンテカルロ法 (MCMC) は、確率分布からのサンプリングに使用される一般的な手法です。MCMCはマルコフ連鎖と呼ばれる確率過程を利用することで、目的の分布μ(x)\mu(\bm{x})からのサンプリングを実現します。ここでは、MCMCの代表的な実装であるMetropolis-Hastings (MH) アルゴリズム Hastings (1970) を紹介します。

MHアルゴリズムは、ある提案確率Q(yx)Q(\bm{y}|\bm{x})に従ってマルコフ連鎖の新たな遷移xy\bm{x} \rightarrow \bm{y}を生成し、次の採択確率

A(yx)=min(1,μ(y)μ(x)Q(xy)Q(yx)).A(\bm{y} | \bm{x}) = \min \left(1, \frac{\mu(\bm{y})}{\mu(\bm{x})} \cdot \frac{Q(\bm{x} | \bm{y})}{Q(\bm{y} | \bm{x})} \right).

に従って採用または棄却するという2つのステップからなります。この一連の手順により、時刻ttの状態から時刻t+1t+1の状態を生成します。十分な時間が経過したのちには、このマルコフ連鎖の状態はサンプリングしたい分布μ(x)\mu(\bm{x})に従います。よって、十分に遷移を重ねることで、得られるマルコフ連鎖の状態列{x(t)}\{\bm{x}^{(t)}\}を目的のサンプルとして利用できます。

実際に確認してみましょう。先ほど用意したボルツマン分布をMH法でサンプリングしてみます。提案分布にはさまざまなものが使えますが、ここでは最もシンプルな、ランダムなスピンを1つだけ選んで反転させるものを利用します。

rng = np.random.default_rng(seed=0)


def local_update(state: np.ndarray) -> np.ndarray:
    """``state``からランダムに選んだ1スピンを反転させた新しいスピン配置を提案する。"""
    n = len(state)
    flip_index = rng.integers(0, n)
    new_state = state.copy()
    new_state[flip_index] = int(-1 * state[flip_index])
    return new_state

次に、採択確率に従って、提案された遷移を確率的に処理するステップを実装します。この提案分布はQ(xy)=Q(yx)Q(\bm{x} \mid \bm{y}) = Q(\bm{y} \mid \bm{x})を満たすため、採択確率においてQQの比は打ち消されます。したがって、目的分布をボルツマン分布とすると、採択確率は以下の簡潔な形になります:

A(yx)=min(1,μ(y)μ(x))=min(1,exp(β(E(y)E(x)))).A(\bm{y} | \bm{x}) = \min \left(1, \frac{\mu(\bm{y})}{\mu(\bm{x})}\right) = \min \left(1, \exp(-\beta (E(\bm{y}) - E(\bm{x})))\right).
def metropolis_hastings(
    state: np.ndarray,
    new_state: np.ndarray,
    energy_func: Callable[[np.ndarray], float],
    beta: float,
) -> np.ndarray:
    """逆温度``beta``のボルツマン分布に対するMetropolis-Hastingsルールで
    ``new_state``を``state``に対して採択または棄却する。"""

    delta_energy = energy_func(new_state) - energy_func(state)

    if delta_energy < 0 or rng.random() < np.exp(
        -beta * delta_energy
    ):  # delta_energy < 0 のとき、新状態は常により低エネルギーで採択される。
        return new_state
    else:
        return state

これでMCMCが実装できました。それでは、MCMCを使ってサンプリングしてみましょう。

T = 100 if docs_test_mode else 1000  # MCMCのステップ数
beta = 0.5  # 逆温度

sample = np.zeros((T, n_spins))
state = np.ones(n_spins)  # 初期状態

for t in range(T):
    new_state = local_update(state)
    state = metropolis_hastings(state, new_state, ising_energy, beta)
    sample[t] = state

得られたサンプル列がボルツマン分布に従っているかを確認しましょう。得られたサンプルを用いて、ボルツマン分布μ(x)\mu(\bm{x})に関する物理量を推定してみます。ここでは、スピンの平均磁化:

m=xμ(x)m(x)\langle m \rangle = \sum_{\bm{x}} \mu(\bm{x}) m(\bm{x})

を推定します。磁化は、

m(x)=1ni=1nxim(\bm{x}) = \frac{1}{n} \sum_{i=1}^n x_i

です。平均磁化は磁化のボルツマン分布に関する期待値なので、サンプル数を増やすとともに、得られたサンプル列がボルツマン分布に近いほど推定精度はよくなるはずです。MCMCのtt番目までのサンプルによる推定量mˉt\bar{m}_tをプロットしてみましょう。

def average_magnetization(sample: np.ndarray) -> float:
    """形状``(T, n_spins)``のMCMCサンプルから平均磁化の推定値を返す。"""
    magnetization = np.mean(sample, axis=1)
    return np.mean(magnetization)


sample_magnetization = np.array(
    [average_magnetization(sample[:i]) for i in range(1, T + 1)]
)

# 現在の逆温度 beta におけるボルツマン分布から、平均磁化の理論値を計算
weights = np.exp(-beta * energies)
probs = weights / weights.sum()
magnetization_per_state = all_states.mean(axis=1)
theoretical_magnetization = np.sum(probs * magnetization_per_state)
# Z2 対称性: 全スピン反転は (h_i = 0 の) エネルギーを変えず磁化だけ反転させるので、
# ボルツマン重み付き平均はぴったり 0 になる — しかも {+spins, -spins} の対は同じ
# `probs` を共有するため浮動小数演算上も誤差なくキャンセルする。
assert theoretical_magnetization == 0.0
assert np.isclose(probs.sum(), 1.0)

plt.plot(sample_magnetization, label="MCMC estimate")
plt.axhline(
    theoretical_magnetization,
    color="red",
    linestyle="--",
    label=f"Theoretical ({theoretical_magnetization:.3f})",
)
plt.xlabel("Step")
plt.ylabel("Magnetization")
plt.title("Magnetization vs. Step")
plt.legend()
plt.show()
<Figure size 640x480 with 1 Axes>

アルゴリズム

Quantum-enhanced MCMCアルゴリズムは、量子回路からのサンプリングを提案分布として利用するMCMCです Layden et al. (2023)。現在の状態x\bm{x}から始め、量子回路UUを作用させて計算基底で測定することで、新たな状態y\bm{y}を得ます。このとき、提案分布Q(yx)Q(\bm{y}|\bm{x})は以下のようになります:

Q(yx)=yUx2Q(\bm{y}|\bm{x}) = \| \langle \bm{y} | U | \bm{x} \rangle \|^2

この確率を直接計算するのは困難ですが、量子回路がU=UU = U^\topを満たすとき、提案分布はQ(xy)=Q(yx)Q(\bm{x} \mid \bm{y}) = Q(\bm{y} \mid \bm{x})を満たし、採択確率の中でQQの項は打ち消されるため、QQを明示的に計算する必要がなくなります。例えば、イジング模型のボルツマン分布をサンプリングするためには、時間に依存しないハミルトニアンによるTrotter化された時間発展を利用できます:

U(γ,t)=exp(iHt),H=(1γ)αHM+γHC.U(\gamma, t) = \exp(-i H t), \quad \quad H = (1-\gamma) \alpha H_M + \gamma H_C.

ここで、HMH_Mはミキサーハミルトニアンと呼ばれ、状態間の量子遷移を生み出します。一方、HCH_Cはイジングハミルトニアンです。γ[0,1]\gamma \in [0,1]は2つの項の重みを制御するパラメータです。α\alphaは、ミキサーハミルトニアンとコストハミルトニアンの固有値のスケールを揃えるための規格化因子です。(γ,t)(\gamma, t)はMCMCの効率を決める調整可能なパラメータです。


アルゴリズムの実装

1. ハミルトニアンの準備

いよいよ、アルゴリズムを実装していきましょう。まず、サンプリングしたいモデルのイジングハミルトニアンHCH_Cと、提案回路UUのためのミキサーハミルトニアンHMH_Mを準備します。

from qamomile.observable.hamiltonian import Hamiltonian, X, Z

mixer_hamiltonian = Hamiltonian()
for i in range(n_spins):
    mixer_hamiltonian += X(i)

cost_hamiltonian = Hamiltonian()
for i in range(n_spins - 1):
    cost_hamiltonian += -J * Z(i) * Z(i + 1)

2. 量子回路の構築

次に、量子回路を実装していきましょう。まず、現在の状態x\bm{x}を入力状態として符号化するため、computational_basis_stateを用いて量子状態x\ket{\bm{x}}を準備します。提案遷移にはTrotter分解に基づく時間発展シミュレーションを利用します。先ほど準備したハミルトニアンに対する回路を、trotterized_time_evolutionを使って構築します。

import qamomile.circuit as qmc
from qamomile.circuit.algorithm import (
    computational_basis_state,
    trotterized_time_evolution,
)


@qmc.qkernel
def qemcmc_circuit(
    n: qmc.UInt,
    input_bits: qmc.Vector[qmc.UInt],
    Hs: qmc.Vector[qmc.Observable],
    order: qmc.UInt,
    time: qmc.Float,
    step: qmc.UInt,
) -> qmc.Vector[qmc.Bit]:
    """QeMCMC用の提案回路: ``n``量子ビット上に``|input_bits>``を準備し、
    指定した``order``の鈴木-Trotter分解で全時間``time``、``step``ステップに
    わたり``sum_k Hs[k]``の時間発展を作用させ、最後に全量子ビットを測定する。"""
    q = qmc.qubit_array(n, name="q")

    # step 1: 初期状態を準備
    q = computational_basis_state(q, input_bits)

    # step 2: ミキサー/コストハミルトニアンによるTrotter化された時間発展を適用
    q = trotterized_time_evolution(q, Hs, order, time, step)

    return qmc.measure(q)

3. トランスパイル

カーネルをトランスパイルします。量子回路を実行するには、ハミルトニアンの混合係数γ\gammaとシミュレーション時間ttを固定する必要があります。 Christmann et al. (2025) に従い、γ=0.45\gamma=0.45t=12t=12Δt=0.8\Delta t = 0.8と設定します。トランスパイル時にnordertimestepをバインドし、input_bitsはランタイムパラメータとして残します。

from qamomile.qiskit import QiskitTranspiler

gamma = 0.45  # 混合係数
time = 12.0  # 総発展時間
delta_t = 0.8  # Trotterステップの時間幅
step = int(time/delta_t)
order = 2  # Suzuki-Trotter近似次数
assert step == 15  # 12.0 / 0.8

Hs = [
    (1 - gamma) * mixer_hamiltonian,
    gamma * cost_hamiltonian,
]
assert len(Hs) == 2

transpiler = QiskitTranspiler()

executable = transpiler.transpile(
    qemcmc_circuit,
    bindings={
        "n": n_spins,
        "Hs": Hs,
        "order": order,
        "time": time,
        "step": step,
    },
    parameters=["input_bits"],
)

4. 量子回路をMCMCに組み込む

これで量子回路シミュレーションの準備が整いました。最後に、量子計算のブロックをMCMCに組み込みましょう。回路の入力および出力はビット列x{0,1}n\bm{x} \in \{0,1\}^nであるため、スピン変数s{1,1}n\bm{s} \in \{1, -1\}^nとの変換も準備しておきます。

def spin_binary_convert(x: np.ndarray, *, input_kind: str = "auto") -> np.ndarray:
    """スピン変数 {-1, +1} ↔ バイナリ変数 {0, 1} の相互変換。

    ``input_kind`` で入力の表現を指定します。``"spin"`` は ``x`` を {-1, +1}
    として扱いバイナリを返し、``"binary"`` は {0, 1} として扱いスピンを返
    します。デフォルトの ``"auto"`` は値から推論しますが、全要素が 1 で
    曖昧な場合は ``ValueError`` を投げます。
    """
    x = np.asarray(x, dtype=int)
    values = np.unique(x)

    if input_kind == "spin":
        if not np.all(np.isin(values, [-1, 1])):
            raise ValueError(
                f"input_kind='spin' は {{-1, 1}} の要素を要求します: {values.tolist()}"
            )
        return (1 - x) // 2
    if input_kind == "binary":
        if not np.all(np.isin(values, [0, 1])):
            raise ValueError(
                f"input_kind='binary' は {{0, 1}} の要素を要求します: {values.tolist()}"
            )
        return 1 - 2 * x
    if input_kind != "auto":
        raise ValueError(
            f"input_kind は 'spin', 'binary', 'auto' のいずれか: {input_kind!r}"
        )

    if np.any(values == -1) and np.all(np.isin(values, [-1, 1])):
        return (1 - x) // 2
    if np.any(values == 0) and np.all(np.isin(values, [0, 1])):
        return 1 - 2 * x
    if np.array_equal(values, [1]):
        raise ValueError(
            "入力が全て 1 のためスピン/バイナリを判別できません。"
            "input_kind='spin' または input_kind='binary' を明示してください。"
        )
    raise ValueError(
        f"要素は {{-1, 1}} または {{0, 1}} のみ許容されます: {values.tolist()}"
    )


def quantum_proposal(state: np.ndarray, executable: Any, executor: Any) -> np.ndarray:
    """現在のスピン状態を入力として量子回路から提案状態を得る。"""
    binary_state = spin_binary_convert(state, input_kind="spin").tolist()
    result = executable.sample(
        executor,
        shots=1,
        bindings={"input_bits": binary_state},
    ).result()
    ((proposed_bits, _count),) = result.results
    return spin_binary_convert(np.array(proposed_bits, dtype=int), input_kind="binary")

実行例

実装したQeMCMCアルゴリズムを実行してみましょう。先ほどよりも低温の β=1.0\beta = 1.0 に設定し、古典MCMCの局所更新では混合が遅くなる条件で量子提案分布の挙動を観察します。公平な比較のため、同じ β=1.0\beta = 1.0 で古典MCMCも併走させます。

from qiskit_aer import AerSimulator

beta = 1.0  # 局所更新では混合が遅くなる低温に切り替える
T_quantum = (
    20 if docs_test_mode else 1000
)  # 量子回路シミュレーションのコストが高いため小さめに設定

# beta=1.0 におけるボルツマン分布から平均磁化の理論値を再計算
weights = np.exp(-beta * energies)
probs = weights / weights.sum()
theoretical_magnetization = np.sum(probs * magnetization_per_state)
# Z2 対称性により依然として 0 — beta は対の重みを変えるだけで {+spins, -spins}
# の縮退を破らない。
assert theoretical_magnetization == 0.0

# 比較用に同じ beta、同じステップ数で古典MCMCも実行
classical_compare_sample = np.zeros((T_quantum, n_spins))
state = np.ones(n_spins)  # 初期状態
for t in range(T_quantum):
    new_state = local_update(state)
    state = metropolis_hastings(state, new_state, ising_energy, beta)
    classical_compare_sample[t] = state

# QeMCMC
executor = transpiler.executor(backend=AerSimulator(seed_simulator=7))
quantum_sample = np.zeros((T_quantum, n_spins), dtype=int)
state = np.ones(n_spins, dtype=int)  # 初期状態
for t in range(T_quantum):
    proposed_state = quantum_proposal(state, executable, executor)
    state = metropolis_hastings(state, proposed_state, ising_energy, beta)
    quantum_sample[t] = state
# 両 chain とも n_spins サイト・T_quantum サンプル分の +/- 1 スピン列を生成済み。
assert quantum_sample.shape == (T_quantum, n_spins)
assert classical_compare_sample.shape == (T_quantum, n_spins)
assert set(np.unique(quantum_sample).tolist()).issubset({-1, 1})

平均磁化の推定量を計算し、同じ β=1.0\beta = 1.0 で実行した古典MCMCの結果と比較します。

quantum_sample_magnetization = np.array(
    [average_magnetization(quantum_sample[:i]) for i in range(1, T_quantum + 1)]
)
classical_compare_magnetization = np.array(
    [average_magnetization(classical_compare_sample[:i]) for i in range(1, T_quantum + 1)]
)

plt.plot(classical_compare_magnetization, label="MCMC estimate")
plt.plot(quantum_sample_magnetization, label="QeMCMC estimate")
plt.axhline(
    theoretical_magnetization,
    color="red",
    linestyle="--",
    label=f"Theoretical ({theoretical_magnetization:.3f})",
)
plt.xlabel("Step")
plt.ylabel("Magnetization")
plt.title("Magnetization vs. Step")
plt.legend()
plt.show()
<Figure size 640x480 with 1 Axes>

まとめ

本チュートリアルでは、古典的なMetropolis-Hastings法によるMCMCの復習からはじめ、量子回路U(γ,t)=exp(itH)U(\gamma, t) = \exp(-i t H)H=(1γ)HM+γHCH = (1-\gamma) H_M + \gamma H_C)を提案分布として利用するQuantum-enhanced MCMC (QeMCMC) をQamomile上で実装しました。具体的には、qamomile.observableでミキサー/コストハミルトニアンを準備したうえで、@qkernelの中でtrotterized_time_evolutionを用いたSuzuki-Trotter時間発展による提案回路を構築しました。最後に、トランスパイルされたexecutorを介して量子提案分布を既存のMHループに組み込み、古典MCMCとQeMCMCを同一のイジング鎖上で走らせて平均磁化の収束を比較することで、一連の量子古典ハイブリッドループが意図どおり動作することを確認しました。

References
  1. Layden, D., Mazzola, G., Mishmash, R. V., Motta, M., Wocjan, P., Kim, J.-S., & Sheldon, S. (2023). Quantum-enhanced Markov chain Monte Carlo. Nature, 619(7969), 282–287. 10.1038/s41586-023-06095-4
  2. Hastings, W. K. (1970). Monte Carlo sampling methods using Markov chains and their applications. Biometrika, 57(1), 97–109. 10.1093/biomet/57.1.97
  3. Layden, D., Mazzola, G., Mishmash, R. V., Motta, M., Wocjan, P., Kim, J.-S., & Sheldon, S. (2023). Quantum-enhanced Markov chain Monte Carlo. Nature, 619(7969), 282–287. 10.1038/s41586-023-06095-4
  4. Christmann, J., Ivashkov, P., Chiurco, M., & Mazzola, G. (2025). From quantum-enhanced to quantum-inspired Monte Carlo. Physical Review A, 111(4). 10.1103/physreva.111.042615