Hammersleya -Clifforda jest wynikiem teorii prawdopodobieństwa , statystyki matematycznej i mechaniki statystycznej , który daje konieczne i wystarczające warunki, w których ściśle dodatni rozkład prawdopodobieństwa (zdarzeń w przestrzeni prawdopodobieństwa ) [ wymagane wyjaśnienie ] może być przedstawiony jako zdarzenia generowane przez Sieć Markowa (znana również jako pole losowe Markowa ). Jest to podstawowe twierdzenie pól losowych . Stwierdza, że rozkład prawdopodobieństwa, który ma ściśle dodatnią masę lub gęstość , spełnia jedną z właściwości Markowa w odniesieniu do nieskierowanego wykresu G wtedy i tylko wtedy, gdy jest polem losowym Gibbsa , to znaczy, że jego gęstość można rozłożyć na czynniki przez kliki ( lub kompletne podgrafy ) wykresu.
Związek między polami losowymi Markowa i Gibbsa został zapoczątkowany przez Rolanda Dobrushina i Franka Spitzera w kontekście mechaniki statystycznej . Twierdzenie nosi imię Johna Hammersleya i Petera Clifforda, którzy udowodnili równoważność w niepublikowanym artykule w 1971 r. Prostsze dowody wykorzystujące zasadę włączenia-wyłączenia zostały podane niezależnie przez Geoffreya Grimmetta , Prestona i Shermana w 1973 r., Z dalszym dowodem Juliana Besaga w 1974 roku.
Zarys dowodu
Prosta sieć Markowa do wykazania, że dowolne pole losowe Gibbsa spełnia każdą właściwość Markowa.
własność Markowa, jest trywialną sprawą . Jako przykład tego faktu, patrz:
Na obrazku po prawej pole losowe Gibbsa nad podanym wykresem ma postać
Pr ( A , B , C , D , E , F ) ∝
f
1
( A , B , D )
f
2
( A , C , D )
fa
3
( do , re , fa )
fa
4
( do
, mi , fa )
{\ Displaystyle \ Pr (A, B, C, D, E, F) \ propto f_ {1} (A, B, D) f_ {2} (A, C, D) f_ {3 }(C,D,F)f_{4}(C,E,F)}
.
, b
:
Jeśli
mi , fa
|
do , re {\ Displaystyle A
B \ perp E, F | C, D}
zmienne są
ZA
ustalone
, to globalna właściwość Markowa wymaga,
⊥
aby
, re
,
{\ displaystyle C, D}
(patrz warunkowa niezależność ), ponieważ do tworzy barierę między
ZA , b
{\ Displaystyle A, B}
i
mi , fa
{\ displaystyle E, F}
.
ze
1
stałą
,
mi
ZA , do {\ displaystyle
i
Pr ( ZA , b ,
( ZA , b , re )
fa
2
(
C}
, fa
| do
= do , re = re ) ∝ [
fa
re
{ \ displaystyle D } do , re ) ] ⋅ [
fa
3
( do , re , fa )
fa
4
( do , mi , fa ) ] =
sol
1
( ZA , b )
sol
2
( mi , fa )
{\ Displaystyle \ Pr (A, B, E, F | C = c ,D=d)\propto [f_{1}(A,B,d)f_{2}(A,c,d)]\cdot [f_{3}(c,d,F)f_{4}( c,E,F)]=g_{1}(A,B)g_{2}(E,F)}
gdzie
g
1
( A , B ) =
f
1
( ZA , b , re )
fa
2
( ZA , do , re )
{\ Displaystyle g_ {1} (A, B) = f_ {1} (A, B, d) f_ {2} (A, c, re)}
i
sol
2
( mi , fa ) =
fa
3
( do , re , fa )
fa
4
( do , mi , fa )
{\ Displaystyle g_ {2} (E, F) = f_ {3} (c, d, F) f_ {4} (c, E, F)}
. Oznacza to, że
A , B ⊥ E , F
|
do , re
{\ Displaystyle A, B \ sprawca E, F | C, D}
.
Aby ustalić, że każdy dodatni rozkład prawdopodobieństwa, który spełnia lokalną własność Markowa, jest również polem losowym Gibbsa, należy udowodnić następujący lemat, który zapewnia środki do łączenia różnych faktoryzacji:
Lemat 1 zapewnia środki do łączenia faktoryzacji, jak pokazano na tym diagramie. Zwróć uwagę, że na tym obrazie nakładanie się zestawów jest ignorowane.
Lemat 1
Niech
U
{\ displaystyle U}
oznacza zbiór wszystkich rozważanych zmiennych losowych i niech
Θ ,
Φ
1
,
Φ
2
, … ,
Φ
n
⊆ U
{\ Displaystyle \ Theta, \ Phi _ {1}, \ Phi _ { 2}, \ kropki, \ Phi _ {n} \ subseteq U}
i
Ψ
1
,
Ψ
2
, … ,
Ψ
m
⊆ U
{\ Displaystyle \ Psi _ {1}, \ Psi _ {2}, \ kropki, \ Psi _{m}\subseteq U}
oznaczają dowolne zestawy zmiennych. (Tutaj, biorąc pod uwagę dowolny zestaw zmiennych ,
X {\ displaystyle
}
.
X
będzie również oznaczać dowolne przypisanie do zmiennych z
X
{\ displaystyle X}
)
Jeśli
Pr ( U ) = fa ( Θ )
∏
ja = 1
n
sol
ja
(
Φ
ja
) =
∏
jot = 1
m
h
jot
(
Ψ
jot
)
{\ Displaystyle \ Pr (U) = f (\ Theta) \ prod _ { i=1}^{n}g_{i}(\Phi _{i})=\prod _{j=1}^{m}h_{j}(\Psi _{j})}
dla funkcji
fa ,
sol
1
,
sol
2
, …
sol
n
{\ Displaystyle f, g_ {1}, g_ {2}, \ kropki g_ {n}}
i
h
1
,
h
2
, ... ,
h
m
{\ Displaystyle h_ {1},h_{2},\dots ,h_{m}}
, to istnieją funkcje
h
1
′
,
h
2
′
, … ,
h
m
′
{\ Displaystyle h'_ {1}, h'_ {2}, \ kropki, h'_ {m}}
1
′
sol
2
′
,
… sol
n
′
{
\
i
Displaystyle g'_ {1} ,g'_{2},\kropki ,g'_{n}}
sol takie, że
Pr ( U ) =
(
∏
jot = 1
m
h
jot
′
( Θ ∩
Ψ
jot
)
)
(
∏
ja = 1
n
sol
ja
′
(
Φ
ja
)
)
{\ Displaystyle \ Pr (U) = {\ bigg (} \ prod _{j=1}^{m}h'_{j}(\Theta \cap \Psi _{j}){\bigg )}{\bigg (}\prod _{i=1}^{n }g'_{i}(\Phi _{i}){\bigg )}}
Innymi słowy,
∏
j = 1
m
h
jot
(
Ψ
jot
)
{\ Displaystyle \ prod _ {j = 1} ^ {m} h_ {j} (\ Psi _ {j})
}
fa ( Θ )
{\ Displaystyle f (\ Theta)}
.
Dowód lematu 1
∏
j = 1
m
h
jot
(
Ψ
jot
) {\
\ prod _ {j = 1} ^ {m} h_ {j} (\ Psi _ {j})}
Displaystyle jako szablon do dalszego rozkładu na czynniki
f ( Θ )
{\ Displaystyle f (\ Theta)}
, wszystkie zmienne poza
Θ
{\ Displaystyle \ Theta}
muszą zostać naprawione. W tym celu niech będzie dowolnym ustalonym przypisaniem do zmiennych z
θ ¯
{\ Displaystyle {\ bar {\ theta}}}
U ∖ Θ
{\ Displaystyle U \ setminus \ Theta}
(zmienne nie w
Θ
{\ Displaystyle \ Theta}
). Dla dowolnego zestawu zmiennych niech oznaczają przypisanie
θ ¯ [ X
] {
\
{
\ bar {\ theta}} [X]}
Displaystyle
{
θ ¯
\ Displaystyle {\ bar {\ theta}} }
ograniczone do zmiennych z (zmienne z
X ∖ Θ {
\ setminus \ Theta}
\
Displaystyle X
, wyłączając zmienne z
Θ
{\ displaystyle \ Theta}
).
czynniki
sol
1
(
Φ
1
)
sol
2
(
Φ
,
2
Ponadto
. . . sol
n
n
(
Φ
n
)
{\ Displaystyle g_ {1} (\ Phi _ {1}), g_ {2} (\ Phi _ {2}), ..., g_ {n} (\ Phi _ { })}
, aby rozłożyć tylko
na
) ,
czynniki
,
inne muszą zostać uznane za dyskusyjne dla zmiennych z
Θ
{\ displaystyle \ Theta}
. Aby to zrobić, faktoryzacja
Pr ( U ) = fa ( Θ )
∏
ja = 1
n
sol
ja
(
Φ
ja
)
{\ Displaystyle \ Pr (U) = f (\ Theta) \ prod _ {i = 1} ^ {n} g_ {i} (\ Phi _ {i})}
zostanie ponownie wyrażony jako
Pr ( U ) =
(
fa ( Θ )
∏
ja = 1
n
sol
ja
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] )
)
(
∏
ja = 1
n
sol
ja
(
Φ
ja
)
sol
ja
(
Φ
ja
∩ Θ ,
θ¯ _
[
Φ
ja
] )
)
{\ Displaystyle \ Pr (U) = {\ bigg (} f (\ Theta) \ prod _ {i = 1} ^ {n} g_ {i} (\ Phi _ {i} \ cap \Theta ,{\bar {\theta}}[\Phi _{i}]){\bigg )}{\bigg (}\prod _{i=1}^{n}{\frac {g_{i} (\Phi _{i})}{g_{i}(\Phi _{i}\cap \Theta,{\bar {\theta}}[\Phi _{i}])}}{\bigg)} }
Dla każdego
i = 1 , 2 , . . . n
)
{\ Displaystyle i = 1,2, ..., n}
θ
Ż
[
Φ
ja
]
: sol ja ( Φ ja ∩ Θ
{
\ Displaystyle
g_
{
i
} (
\ Phi _ {i} \ czapka \ Theta , {\ bar {\ theta}} [\ Phi _ {i}]}}
, jest
sol
ja
(
Φ
ja
)
{\ Displaystyle g_ {i} (\ Phi _ {i})}
gdzie wszystkie zmienne poza
Θ
{\ Displaystyle \ Theta}
zostały ustalone na wartości określone przez
θ ¯
{\ Displaystyle {\ bar {\ theta}}}
.
Niech
fa ′
( Θ ) = fa ( Θ )
∏
ja = 1
n
sol
ja
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] )
{\ Displaystyle f '(\ Theta) = f (\ Theta) \ prod _ { i=1}^{n}g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Fi _{i}])}
g
i
ja
′
(
Φ
ja
) =
g
ja
(
Φ
ja
)
sol
ja
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] )
{\ Displaystyle g'_ {i} (\ Phi _ {i}) = {\ Frac {g_ {i} (\ Phi _ {i} })}{g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])}}} dla
każdego
i = 1 , 2 , … , n
{\ Displaystyle i = 1,2, \ kropki, n}
tak
Pr ( U ) =
fa ′
( Θ )
∏
ja = 1
n
sol
ja
′
(
Φ
ja
) =
∏
jot = 1
m
h
jot
(
Ψ
jot
)
{\ Displaystyle \ Pr (U) = f '(\ Theta) \ prod _{i=1}^{n}g'_{i}(\Phi _{i})=\prod _{j=1}^{m}h_{j}(\Psi _{j}) }
Najważniejsze jest to, że
sol
ja
′
(
Φ
ja
) =
sol
ja
(
Φ
ja
)
sol
ja
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] )
= 1
{\ Displaystyle g'_ {i} (\ Phi _ {i})={\frac {g_{i}(\Phi _{i})}{g_{i}(\Phi _{i}\cap \Theta ,{\bar {\theta }}[\Phi _ {i}])}}} = 1}
, gdy wartości przypisane do
Φ
ja
{\ Displaystyle \ Phi _ {i}}
θ ¯ {\ Displaystyle {\ bar
Φ
{
{\ theta}}} sol ja ′
(
\
Displaystyle
g'_
{
i} (\ Phi _ {i})}
ja ) " znikają”
¯ {\
,
{\ bar {\ theta}}}
gdy wszystkie zmienne, których nie ma , są ustalane na wartości z
θ
Displaystyle
.
Naprawianie wszystkich zmiennych nie w
Θ
{\ Displaystyle \ Theta}
do wartości z daje
θ ¯
{\ Displaystyle {\ bar {\ theta}}}
Pr ( Θ ,
θ ¯
) =
fa ′
( Θ )
∏
ja = 1
n
sol
ja
′
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] ) =
∏
jot = 1
m
godz
jot
(
Ψ
jot
∩ Θ ,
θ ¯
[
Ψ
j
] )
{\ Displaystyle \ Pr (\ Theta, {\ bar {\ theta}}) = f' (\ Theta) \ prod _ {i = 1} ^ {n} g'_ {i} (\ Phi _ { i}\cap \Theta ,{\bar {\theta }}[\Phi _{i}])=\prod _{j=1}^{m}h_{j}(\Psi _{j}\cap \Theta ,{\bar {\theta}}[\Psi _{j}])}
ponieważ
sol
ja
′
(
Φ
ja
∩ Θ ,
θ ¯
[
Φ
ja
] ) = 1
{\ Displaystyle g'_ {i} (\ Phi _ {i} \ czapka \ Theta, {\ bar {\ theta}} [\ fi _{i}])=1}
,
fa ′
( Θ ) =
∏
jot = 1
m
godz
jot
(
Ψ
jot
∩ Θ ,
θ ¯
[
Ψ
jot
] )
{\ Displaystyle f '(\ Theta) = \ prod _ {j = 1} ^ {m} h_ { j}(\Psi_{j}\cap \Theta,{\bar {\theta}}[\Psi_{j}])}
Pozwalając
h
jot
′
( Θ ∩
Ψ
jot
) =
h
jot
(
Ψ
jot
∩ Θ ,
θ ¯
[
Ψ
jot
] )
{\ Displaystyle h'_ {j} (\ Theta \ cap \ Psi _ {j}) = h_ { j}(\Psi _{j}\cap \Theta ,{\bar {\theta }}[\Psi _{j}])}
daje:
fa ′
( Θ ) =
∏
jot = 1
m
h
jot
′
( Θ ∩
Ψ
jot
)
{\ Displaystyle f '(\ Theta) = \ prod _ {j = 1} ^ {m} h'_ {j} (\ Theta \cap \Psi _{j})}
co ostatecznie daje:
Pr ( U ) =
(
∏
jot = 1
m
h
jot
′
( Θ ∩
Ψ
jot
)
)
(
∏
ja = 1
n
sol
ja
′
(
Φ
ja
)
)
{\ Displaystyle \ Pr (U) = {\ bigg (} \ prod _{j=1}^{m}h'_{j}(\Theta \cap \Psi _{j}){\bigg )}{\bigg (}\prod _{i=1}^{n }g'_{i}(\Phi _{i}){\bigg )}}
Klika utworzona przez wierzchołki ,
x
2
i
1
jest
{\ Displaystyle x_ {2}}
{
x
x
} ∪ ∂
x
1
{\ Displaystyle \ {x_ {1} \} \ kubek \ częściowe x_ {1}}
3
{
\
Displaystyle x_ {3}}
przecięciem ,
{
x
2
} ∪ ∂
x
2
{\ Displaystyle \ {x_ {2} \} \ kubek \ częściowe x_ {2}}
i
{
x3
_
}
∪ ∂
x
3
{\ Displaystyle \ {x_ {3} \} \ kubek \ częściowe x_ {3}}
.
Lemat 1 zapewnia sposób łączenia dwóch różnych rozkładów na czynniki
Pr ( U )
{\ Displaystyle \ Pr (U)}
. Lokalna właściwość Markowa implikuje, że dla dowolnej zmiennej losowej istnieją takie czynniki i
fa
- x
}
{
{ \ displaystyle x \ in
\ displaystyle f_ {-x
fa
}
x ∈ U
U}
jak To:
Pr ( U ) =
fa
x
( x , ∂ x )
fa
- x
( U ∖ { x } )
{\ Displaystyle \ Pr (U) = f_ {x} (x, \ częściowe x) f_ {- x} (U \setminus \{x\})}
gdzie są sąsiadami węzła
∂
x {
\
displaystyle \ x}
. Wielokrotne stosowanie
kliki (
lematu
.
patrz obrazek
1 ostatecznie rozkłada na iloczyn potencjałów po prawej)
Koniec dowodu
Zobacz też
Notatki
Dalsza lektura
Bilmes, Jeff (wiosna 2006), Handout 2: Hammersley – Clifford (PDF) , notatki z kursu University of Washington .
Grimmett, Geoffrey (2018), „7.”, Prawdopodobieństwo na wykresach (wyd. 2), Cambridge University Press, ISBN 9781108438179
Langseth, Helge, The Hammersley-Clifford Theorem and its Impact on Modern Statistics (PDF) , Wydział Nauk Matematycznych Norweskiego Uniwersytetu Nauki i Technologii