RÓŻOWY (metryczny)

ROUGE lub Recall-Oriented Understudy for Gisting Evaluation to zestaw wskaźników i pakiet oprogramowania służący do oceny oprogramowania do automatycznego podsumowania i tłumaczenia maszynowego w przetwarzaniu języka naturalnego . Metryki porównują automatycznie wygenerowane streszczenie lub tłumaczenie z odniesieniem lub zestawem odniesień (stworzone przez człowieka) streszczeniem lub tłumaczeniem.

Metryka

Dostępnych jest pięć następujących metryk oceny.

  • ROUGE-N: Nakładanie się n-gramów między podsumowaniem systemowym i referencyjnym.
    • ROUGE-1 odnosi się do nakładania się unigramu (każdego słowa) między systemem a podsumowaniami referencyjnymi.
    • ROUGE-2 odnosi się do nakładania się bigramów między systemowymi i streszczeniami referencyjnymi.
  • ROUGE-L: Statystyki oparte na najdłuższej wspólnej podsekwencji (LCS). Najdłuższy wspólny problem podsekwencji w naturalny sposób uwzględnia podobieństwo struktury na poziomie zdań i automatycznie identyfikuje najdłuższe współwystępujące w sekwencji n-gramy.
  • ROUGE-W: Ważone statystyki oparte na LCS, które faworyzują kolejne LCS.
  • ROUGE-S: Statystyki współwystępowania oparte na pominięciu bigramu . Skip-bigram to dowolna para słów w kolejności zdań.
  • ROUGE-SU: Statystyki współwystępowania oparte na pomijaniu bigramów i unigramach.

Zobacz też

Linki zewnętrzne