Gramatyka łączenia zakresów
Gramatyka łączenia zakresów (RCG) to formalizm gramatyczny opracowany przez Pierre'a Boulliera w 1998 roku jako próba scharakteryzowania szeregu zjawisk języka naturalnego, takich jak liczby chińskie i szyfrowanie kolejności słów w języku niemieckim , które wykraczają poza granice umiarkowanie kontekstowego języki .
Z teoretycznego punktu widzenia każdy język, który można analizować w czasie wielomianowym, należy do podzbioru RCG zwanego gramatyką konkatenacyjną o zakresie dodatnim i odwrotnie.
gramatyk ruchu dosłownego (LMG) Groeninka , RCG traktują proces gramatyczny bardziej jako dowód niż jako produkcję. Podczas gdy LMG tworzą ciąg końcowy z predykatu początkowego, RCG mają na celu redukcję predykatu początkowego (który jest predykatem ciągu końcowego) do pustego ciągu, co stanowi dowód przynależności ciągów końcowych do języka.
Opis
Definicja formalna
Gramatyka łączenia zakresu dodatniego (PRCG) to krotka , gdzie:
- i rozłącznymi zbiorami (odpowiednio) nazw , symboli i zmiennych . Z każdą nazwą predykatu jest powiązana arność określona przez funkcję .
- to nazwa predykatu początkowego i sprawdź .
- to skończony zbiór klauzul w postaci są predykatami postaci } ∈ } .
Gramatykę łączenia zakresów ujemnych (NRCG) definiuje się podobnie jak PRCG, ale z dodatkiem, że niektóre predykaty występujące po prawej stronie zdania mogą mieć postać . Takie predykaty nazywane są predykatami negatywnymi .
Gramatyka łączenia zakresów jest gramatyczna dodatnia lub ujemna. Chociaż PRCG są technicznie NRCG, terminy te są używane do podkreślenia braku (PRCG) lub obecności (NRCG) negatywnych predykatów.
Zakres słowa to para , , gdzie jest długością . Dwa zakresy i połączyć mamy .
Dla słowa ja } oznaczenie zakresów z kropkami to: .
Rozpoznawanie ciągów
Podobnie jak LMG, klauzule RCG mają ogólny schemat, gdzie } RCG jest albo pustym ciągiem albo ciągiem predykatów. Argumenty składają się z ciągów symboli końcowych i/lub symboli zmiennych, których wzór pasuje do rzeczywistych wartości argumentów, jak Sąsiednie zmienne tworzą rodzinę dopasowań do partycji, więc argument z dwiema zmiennymi dopasowuje dosłowny ciąg znaków trzy różne sposoby .
Terminy predykatów występują w dwóch postaciach, dodatniej (która w przypadku powodzenia generuje pusty ciąg znaków) i ujemną (która tworzy pusty ciąg znaków w przypadku niepowodzenia/jeśli termin dodatni nie generuje pustego ciągu ) . Terminy negatywne są oznaczane tak samo jak terminy pozytywne, z kreską górną, jak w .
Semantyka przepisywania dla RCG jest raczej prosta, identyczna z odpowiednią semantyką LMG. Biorąc pod ciąg predykatów , gdzie symbole są symbolami. są ciągami końcowymi, jeśli istnieje reguła w której pasuje ciąg predykatów, ciąg predykatów jest zastępowany przez , zastępując w .
Na przykład, biorąc pod uwagę regułę , gdzie i , } i symbolami końcowymi, a ciąg predykatów i ponieważ ( gdy , . Podobnie, gdyby istniała reguła, , można przepisać jako .
Dowód / rozpoznanie ciągu poprzez pokazanie ciąg W poszczególnych etapach przepisywania, gdy możliwych jest wiele alternatywnych dopasowań zmiennych, uwzględniane jest każde przepisanie, które mogłoby doprowadzić do powodzenia całego dowodu. Zatem jeśli najmniej jeden sposób na wygenerowanie pustego ciągu z początkowego ciągu dowód uważa się za udany, niezależnie od tego, ile innych sposobów na porażkę
Przykład
nieliniowy _ następująco:
Niech x, y i z będą symbolami zmiennymi:
Dowód na abbabbabb jest zatem
Lub używając bardziej poprawnej notacji z kropkami dla zakresów:
- ^ Boullier, Pierre (styczeń 1998). Propozycja szkieletu składniowego przetwarzania języka naturalnego (PDF) (raport techniczny). Tom. 3342. INRIA Rocquencourt (Francja).
- ^ Pierre'a Boulliera (1999). „Gramatyki chińskich liczb, MIX, szyfrowania i łączenia zakresów” (PDF) . Proc. EACL . s. 53–60. Zarchiwizowane od oryginału (PDF) w dniu 2003-05-15.
- ^ Eberhard Bertsch i Mark-Jan Nederhof (październik 2001). „O złożoności niektórych rozszerzeń analizowania RCG” (PDF) . Materiały z siódmych międzynarodowych warsztatów na temat technologii analizy składniowej (Pekin) . s. 66–77.
- ^ Laury Kallmeyer (2010). Analizowanie poza gramatyką bezkontekstową . Springer Nauka i media biznesowe. P. 37. ISBN 978-3-642-14846-0 . cytując Bertscha, Nederhof (2001)