最近研究でRietveld解析をやる機会があり,見様見真似で解析自体を進めていくことができたのですが,$R_{\mathrm{wp}}$やら$S$値やらと言われて何がなんだかわからなかったので自分なりに調べてそれらについてまとめつつ,実際に自分も解析を行ったときの「感覚」のようなものも記しておこうと思います.
数式と一緒に説明しているので,イメージが掴みやすいかと思います.ぜひ参考にしてください.
ただ,かなり人や分野によって感覚が異なるようなので,論文等を読んでどれくらいの精度が求められるかは把握した方が良いと思います.
R因子 (信頼性因子) とは
Reliability factor.RIETANというRietveld解析用のソフトウェアのうちの一つを開発されている泉先生の言葉を借りると,
リートベルト解析の進行や観測強度と計算強度 との一致のよさを見積もるための尺度
です.
$R_{\mathrm{wp}}$
$R$-weighted patternで$R_{\mathrm{wp}}$.最も重要なR因子です.
ほとんどのRietveld解析のソフトウェアはこれを最小化するようにプログラムが組まれています.(Z-Rietveld, RIETAN etc.)
具体的には以下の数式で表されます.
$$R_{\mathrm{wp}} = \sqrt{\frac{\displaystyle \sum_{i=1}^N w_i\{y_i - f_i(x)\}^2}{\displaystyle \sum_{i=1}^N w_i y_i^2}}$$
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $w_i$: 重み.ここでは強度の逆数$\left(\frac{1}{y_i}\right)$
- $f_i(x)$: 計算で求めた各点の強度
バックグラウンドが高くなると,分子の「残差 (実際の観測値と計算値の差)」を表す部分には大きな変化が起きないにもかかわらず,分母の強度の合計の値が大きくなるので,$R_{\mathrm{wp}}$自体は小さくなる傾向があります.また,データの強度が大きい場合もバックグラウンドの残差がほとんど0になるため,$R_{\mathrm{wp}}$自体は小さくなる傾向があります.
言い換えると,バックグラウンド強度や回折強度に影響をよく受ける値であるということです.そこで$S$値というものがあるのですが,のちほど触れます.
実体験ですが,昔まあまあ重い元素を含む材料を高輝度X線回折測定にかけたのですが,波長がちょうど吸収端にあたってしまって,バックグラウンドが高くなってしまって$R_{wp}$の絶対値で解析の進捗がわからなくなってしまったことがありました.
きちんと吸収端は確認しましょう,笑
イメージとしては,「計算値とのズレを強度で "規格化" してあげたもの」って感じだと思います.(規格化という表現は正しくないかもしれないですが...)
$R_{\mathrm{p}}$
$R$-patternで$R_{\mathrm{p}}$.$R_{\mathrm{wp}}$の重み付けがないバージョンです.基本的な傾向は$R_{\mathrm{wp}}$と似ています.
具体的な数式は以下に示します.
$$R_{\mathrm{p}} = \sqrt{\frac{\displaystyle \sum_{i=1}^N \{y_i - f_i(x)\}^2}{\displaystyle \sum_{i=1}^N y_i^2}}$$
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $f_i(x)$: 計算で求めた各点の強度
$R_{\mathrm{B}}$
$R$-Braggで$R_{\mathrm{B}}$.$R_{\mathrm{I}}$とも呼ばれます.単結晶構造解析で広く用いられる$R$因子とよく似ています.
ここで,
- $I \left(\underline{o} \right)$: ブラッグ反射$k$の積分強度の推定観測値
- $I (c)$: ブラッグ反射$k$の積分強度の計算値
$\underline{o}$としたのはこれが実際に観測された積分強度ではなく,Rietveld解析の結果から計算した推定値であるためです.実際のところ,$I(\underline{o})$は構造モデルに有利となるように偏っていて,単結晶回折データより信頼性が低いです.
$R_{\mathrm{F}}$
$R$-structure factorで$R_{\mathrm{F}}$.
ここで,
- $I \left(\underline{o} \right)$: ブラッグ反射$k$の積分強度の推定観測値
- $I (c)$: ブラッグ反射$k$の積分強度の計算値
$R_{\mathrm{e}}$
$R$-expectedで$R_{\mathrm{e}}$.
イメージは統計誤差がどれくらい含まれるか,についての指標です.$R_{\mathrm{wp}}$は実測値と計算値の差を計算で用いていますが,その$y_i$は測定値なので統計誤差が含まれています.その統計誤差が大きいなら$R_{\mathrm{wp}}$が合わなくても仕方ないと言えるのでその統計誤差の大きさを見積もる指標のことを$R_{\mathrm{e}}$と言います.
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $w_i$: 重み.ここでは強度の逆数$\left(\frac{1}{y_i}\right)$
- $f_i(x)$: 計算で求めた各点の強度
ここで分子に着目します.Rietveld解析のみならず,一般的に$n$変数関数に対して$n$個データがあったらドンピシャの解が求められます.
たとえば$ax + by + cz + dw = 0$という式で観測データが表せるとしたとき,$(x, y, z, w) = (1, 1, 1, 1), (7, 2, 1, 0), (-5, -2, 1, 1), (0, 2, 4, 4)$という4点の観測データが与えられたらパラメータである$(a, b, c, d) $は,$ (-1, 2, 3, -4)$と決まります.
$$R_{\mathrm{e}} = \sqrt{\frac{N - P}{\displaystyle \sum_{i = 1}^{N} w_i y_i}}$$
ここで,
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $w_i$: 重み.ここでは強度の逆数$\left(\frac{1}{y_i}\right)$
- $P$: パラメータの数
です.
この値の大小が直接解析の進捗を表すのに関わってはきません.(次に述べる$S$値で重要な役割を果たすので全く意味ないわけではないですが,これ単体で議論するのは結晶構造解析という目的からすると意味ないと考えています.)
$S$値
$R$じゃないのに$R$値の一つです.最も重要な指標のうちの一つ.$R_{\mathrm{wp}}$や$R_{\mathrm{e}}$の絶対値を見ただけだと良さがわからないので,それらの比をとることでどれくらい精密化がうまくいっているかの指標となります.$S=1$のとき,精密化が完全にうまくいっていることを意味します.
泉先生は1.3以下なら十分とおっしゃっていますが,自分は先輩から2が目安で,だけど$R_{\mathrm{wp}}$などほかの指標の大きさ,バックグラウンドによって状況は異なると言われました.
自分の解釈ではまあまあ普通の結果が得られていれば2を目安に解析を進めていく,という解釈をしています.
先ほど書いたとおりこの値はあくまで比なので$R_{\mathrm{wp}}$や$R_{\mathrm{e}}$と併記するのが普通です.(3変数のうち2変数書けばもう1変数はわかるのでは,という論理で省略したい場合は$S$と$R_{wp}$だけでもいいと思っています.)
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $w_i$: 重み.ここでは強度の逆数$\left(\frac{1}{y_i}\right)$
- $P$: パラメータの数
$d$
Durbin-Watsonの$d$統計量 (Durbin-Watson statistic) と呼ばれる値です.残差$y_i-f_i(x)$とその隣の測定点の残差$y_{i-1}-f_{i-1}$の間の連続した相関を見積もる尺度です(実際は式を見れば分かりますが,標準偏差で「規格化」のようなことをしています).理想値は2です.精密化の進行度を見ることもできます.
- $y_i$: 各点における強度
- $N$: データ数 (点の数)
- $w_i$: 重み.ここでは強度の逆数$\left(\frac{1}{y_i}\right)$
- $\sigma_i$: $I$番目の回折強度の標準偏差.ここでは$\sqrt{y_i}$.
です.
正直あまりまともに考えたことがないです.自分は掲載しないこともあります.
0 件のコメント:
コメントを投稿