RÓŻOWY (metryczny)
ROUGE lub Recall-Oriented Understudy for Gisting Evaluation to zestaw wskaźników i pakiet oprogramowania służący do oceny oprogramowania do automatycznego podsumowania i tłumaczenia maszynowego w przetwarzaniu języka naturalnego . Metryki porównują automatycznie wygenerowane streszczenie lub tłumaczenie z odniesieniem lub zestawem odniesień (stworzone przez człowieka) streszczeniem lub tłumaczeniem.
Metryka
Dostępnych jest pięć następujących metryk oceny.
- ROUGE-N: Nakładanie się n-gramów między podsumowaniem systemowym i referencyjnym.
- ROUGE-1 odnosi się do nakładania się unigramu (każdego słowa) między systemem a podsumowaniami referencyjnymi.
- ROUGE-2 odnosi się do nakładania się bigramów między systemowymi i streszczeniami referencyjnymi.
- ROUGE-L: Statystyki oparte na najdłuższej wspólnej podsekwencji (LCS). Najdłuższy wspólny problem podsekwencji w naturalny sposób uwzględnia podobieństwo struktury na poziomie zdań i automatycznie identyfikuje najdłuższe współwystępujące w sekwencji n-gramy.
- ROUGE-W: Ważone statystyki oparte na LCS, które faworyzują kolejne LCS.
- ROUGE-S: Statystyki współwystępowania oparte na pominięciu bigramu . Skip-bigram to dowolna para słów w kolejności zdań.
- ROUGE-SU: Statystyki współwystępowania oparte na pomijaniu bigramów i unigramach.