Obrazowalność

Wyobrażalność jest miarą tego, jak łatwo obiekt fizyczny, słowo lub środowisko przywoła wyraźny obraz mentalny w umyśle każdej obserwującej go osoby. Jest używany w architekturze i urbanistyce, w psycholingwistyce oraz w zautomatyzowanych badaniach wizji komputerowej. W automatycznym rozpoznawaniu obrazów modele szkoleniowe w celu łączenia obrazów z koncepcjami, które mają niską zdolność do obrazowania, mogą prowadzić do stronniczych i szkodliwych wyników.

Historia i komponenty

Kevin A. Lynch po raz pierwszy wprowadził termin „obrazowalność” w swojej książce The Image of the City z 1960 roku . W książce Lynch argumentuje, że miasta zawierają kluczowy zestaw elementów fizycznych, których ludzie używają do zrozumienia środowiska, orientacji w nim i przypisania mu znaczenia.

Lynch argumentuje, że pięć kluczowych elementów wpływających na wyobrażalność miasta to ścieżki, krawędzie, dzielnice, węzły i punkty orientacyjne.

  • Ścieżki: kanały, którymi podróżują ludzie. Przykłady: ulice , chodniki , szlaki , kanały , linie kolejowe .
  • Krawędzie : obiekty, które tworzą granice wokół przestrzeni. Przykłady: ściany , budynki , linia brzegowa , krawężnik , ulice i wiadukty .
  • Dzielnice : średnie i duże obszary, do których ludzie mogą wchodzić i wychodzić, które mają wspólny zestaw możliwych do zidentyfikowania cech.
  • Węzły: duże obszary, do których ludzie mogą wejść, które służą jako ogniska miasta, dzielnicy, dzielnicy itp.
  • Punkty orientacyjne : niezapomniane punkty odniesienia, do których ludzie nie mogą wejść. Przykłady: znaki, góry i sztuka publiczna.

W 1914 roku, pół wieku przed publikacją Obrazu miasta , Paul Stern omawiał pojęcie podobne do wyobrażalności w kontekście sztuki. Stern w Refleksjach nad sztuką Susan Langer określa atrybut, który opisuje, jak żywo i intensywnie obiekt artystyczny może być doświadczany przez pozorność.

W wizji komputerowej

Automatyczne rozpoznawanie obrazu zostało opracowane przy użyciu uczenia maszynowego do znajdowania wzorców w dużych, opatrzonych adnotacjami zbiorach danych fotografii, takich jak ImageNet . Obrazy w ImageNet są oznaczane za pomocą pojęć w WordNet . Pojęcia, które można łatwo wyrazić ustnie, takie jak „wczesny”, są postrzegane jako mniej „obrazowe” niż rzeczowniki odnoszące się do obiektów fizycznych, takie jak „liść”. Szkolenie modeli sztucznej inteligencji w celu powiązania pojęć o niskiej możliwości obrazowania z określonymi obrazami może prowadzić do problematycznych błędów w algorytmach rozpoznawania obrazów. Zostało to szczególnie skrytykowane, ponieważ odnosi się do kategorii „osoba” w WordNet, a zatem także w ImageNet. Trevor Pagan i Kate Crawford zademonstrowali w swoim eseju „Excavating AI” i swoim projekcie artystycznym ImageNet Roulette, w jaki sposób prowadzi to do tego, że systemy sztucznej inteligencji oznaczają zwykłych ludzi jako „terrorystów” lub „przestępców seksualnych”.

Obrazy w zestawach danych są często oznaczane jako posiadające określony poziom obrazowalności. Jak opisali Kaiyu Yang, Fei-Fei Li i współautorzy, często odbywa się to zgodnie z kryteriami z psycholingwistycznego badania rzeczowników Allana Paivio i współpracowników z 1968 roku. Yang el al. napisz, że adnotatorzy zbioru danych, których zadaniem jest oznaczanie możliwości obrazowania, „widzą listę słów i oceniają każde słowo w skali od 1 do 7, od „niskiego obrazu” do „wysokiego obrazowania”.

Aby uniknąć stronniczego lub szkodliwego rozpoznawania i generowania obrazu, Yang i in. zalecają, aby nie trenować modeli rozpoznawania wzroku na pojęciach o niskiej obrazowości, zwłaszcza gdy pojęcia są obraźliwe (takie jak obelgi seksualne lub rasowe) lub wrażliwe (ich przykłady dla tej kategorii to „sierota”, „separatysta”, „anglosaski” i „ wyborca ​​krzyżowy”). Nawet „bezpieczne” koncepcje o niskiej rozpoznawalności, takie jak „pra-siostrzenica” czy „wegetarianin”, mogą prowadzić do mylących wyników i należy ich unikać.

Zobacz też

Dalsza lektura

  1. ^ abc Lynch , Kevin    , 1918-1984. (1960). Wizerunek miasta . Cambridge, Massachusetts: MIT Press. ISBN 0-262-12004-6 . OCLC 230082 . {{ cite book }} : CS1 maint: wiele nazwisk: lista autorów ( link )
  2. ^     Dellantonio, Sara; Praca, Remo; Mulatti, Claudio (2014-04-03). „Obrazowalność: teraz widzisz to ponownie (choć w innej formie)” . Granice w psychologii . 5 : 279. doi : 10.3389/fpsyg.2014.00279 . ISSN 1664-1078 . PMC 3982064 . PMID 24765083 .
  3. ^ a b   Paivio, Allan ; Yuille, John C.; Madigan, Stephen A. (1968). „Wartości konkretności, obrazowości i sensowności dla 925 rzeczowników” . Journal of Psychology Eksperymentalnej . 76 (1, część 2): 1–25. doi : 10.1037/h0025327 . ISSN 0022-1015 .
  4. ^ a b c d   Yang, Kaiyu; Qinami, Klint; Fei-Fei, Li ; Deng, Jia; Russakowski, Olga (27.01.2020). „Ku bardziej sprawiedliwym zestawom danych: filtrowanie i równoważenie rozkładu poddrzewa osób w hierarchii ImageNet” . Materiały z konferencji 2020 na temat uczciwości, odpowiedzialności i przejrzystości . TŁUSZCZ* '20. Nowy Jork, NY, USA: Association for Computing Machinery: 547–558. doi : 10.1145/3351095.3375709 . ISBN 978-1-4503-6936-7 .
  5. ^ „Analiza możliwości obrazowania miasta Lyncha w epoce cyfrowej” . Planetizen - wiadomości dotyczące planowania urbanistycznego, praca i edukacja . Źródło 2020-02-15 .
  6. ^    Czytelnik projektowania miejskiego . Larice, Michael, 1962-, Macdonald, Elizabeth, 1959- (wyd. Drugie). Londyn. 2013. ISBN 978-0-203-09423-5 . OCLC 1139281591 . {{ cite book }} : CS1 maint: other ( link )
  7. ^    Langer, Susanne K. (Susanne Katherina Knauth), 1895-1985 (1979) [1958]. Refleksje o sztuce . Nowy Jork: Arno Press. ISBN 0-405-10611-4 . OCLC 4570406 . {{ cite book }} : CS1 maint: wiele nazwisk: lista autorów ( link )
  8. Bibliografia _ _ Trevor, poganin (2019). „Wykopywanie sztucznej inteligencji: polityka obrazów w zestawach danych uczenia maszynowego” . Instytut AI Now .