Międzynarodowy e-mail
Międzynarodowa poczta e-mail powstaje w wyniku połączenia międzynarodowych nazw domen ( IDN ) i internacjonalizacji adresów e-mail ( EAI ). Rezultatem jest wiadomość e-mail zawierająca znaki międzynarodowe (znaki, które nie istnieją w ASCII ), zakodowane jako UTF-8 , w nagłówku wiadomości e-mail oraz w obsłudze protokołów przesyłania poczty. Najbardziej znaczącym aspektem tego jest dopuszczanie adresów e-mail (znanych również jako tożsamości e-mail) w większości światowych systemów pisma, zarówno na poziomie interfejsu, jak i transportu.
Adresy e-mail
Tradycyjne adresy e-mail są ograniczone do znaków z alfabetu angielskiego i kilku innych znaków specjalnych.
Poniżej znajdują się prawidłowe tradycyjne adresy e-mail:
[email protected] (angielski, ASCII) [email protected] (angielski, ASCII) user+mailbox/[email protected] (angielski, ASCII) !#$%&'*+-/=? ^_`.{|}[email protected] (angielski, ASCII) "Abc@def"@example.com (angielski, ASCII) "Fred\ Bloggs"@example.com (angielski, ASCII) "Joe.\\ Blow"@example.com (angielski, ASCII)
Rosjanin może chcieć użyć иван.сергеев@пример.рф jako swojego identyfikatora, ale będzie zmuszony zamiast tego użyć transkrypcji, takiej jak [email protected] lub nawet innego zupełnie niezwiązanego identyfikatora. To samo dotyczy Chińczyków, Japończyków i innych narodowości, które nie używają alfabetu łacińskiego , ale dotyczy to również użytkowników z nieanglojęzycznych krajów europejskich, których żądane adresy mogą zawierać znaki diakrytyczne (np. André lub Płużyna ). W rezultacie użytkownicy poczty e-mail są zmuszeni identyfikować się za pomocą nienatywnych skryptów, co może skutkować błędami wynikającymi z niejednoznaczności transliteracji (na przykład иван.сергеев może stać
się ivan.sergeev
, ivan.sergeyev
lub coś innego). Alternatywnie, twórcy systemów pocztowych muszą to zrekompensować, konwertując identyfikatory z ich natywnych skryptów na skrypty ASCII iz powrotem w warstwie interfejsu użytkownika.
Z kolei międzynarodowa poczta e-mail używa znaków Unicode zakodowanych jako UTF-8 — co pozwala na kodowanie tekstu adresów w większości światowych systemów pisma.
Poniżej znajdują się wszystkie ważne międzynarodowe adresy e-mail :
用户@例子.广告 ( chiński , Unicode ) ಬೆಂಬಲ@ಡೇಟಾಮೇಲ್.ಭಾರತ ( kannada , Unicode) अजय@डाटा.भा रत ( hindi , Unicode) квіточка@пошта.укр ( ukraiński , Unicode) χρήστης@παράδειγμα.ελ ( grecki , Unicode) Dörte@Sörensen.example.com ( niemiecki , Unicode) коля@пример.рф ( rosyjski , Unicode)
nagłówki UTF-8
Chociaż tradycyjny format sekcji nagłówka wiadomości e-mail pozwala na umieszczanie znaków innych niż ASCII w części wartości niektórych pól nagłówka za pomocą słów zakodowanych w MIME (np. w nazwach wyświetlanych lub w polu nagłówka tematu), kodowanie MIME nie może być używany do kodowania innych informacji w nagłówku, takich jak adres e-mail, lub pól nagłówka, takich jak Message-ID lub Received . Co więcej, kodowanie MIME wymaga dodatkowego przetwarzania nagłówka w celu konwersji danych do iz ich reprezentacji słownej zakodowanej w MIME i szkodzi czytelności sekcji nagłówka.
Standardy RFC 6532 i RFC 6531 z 2012 r. zezwalają na umieszczanie znaków Unicode w treści nagłówka przy użyciu kodowania UTF-8 i przesyłanie ich przez SMTP — ale w praktyce wsparcie to rozwija się bardzo powoli.
Interoperacyjność poprzez obniżenie wersji
Internacjonalizacja domeny polega na obniżaniu wersji. Części UTF-8, znane jako etykiety U, są przekształcane w etykiety A za pomocą ad-hoc o nazwie IDNA. Na przykład sörensen.example.com
jest zakodowany jako xn--srensen-90a.example.com
. W 2003 roku, kiedy zajęto się tą potrzebą, wydawało się to łatwiejsze niż sprawdzenie, czy całe oprogramowanie DNS może być zgodne z ciągami znaków UTF-8, chociaż teoretycznie DNS może przenosić dane binarne. To kodowanie jest potrzebne przed wysłaniem zapytań DNS.
Ponieważ tradycyjne standardy poczty e-mail ograniczają wszystkie wartości nagłówków wiadomości e-mail do znaków ASCII, możliwe jest, że obecność znaków UTF-8 w nagłówkach wiadomości e-mail zmniejsza stabilność i niezawodność transportu takich wiadomości e-mail. Dzieje się tak, ponieważ niektóre serwery poczty e-mail nie obsługują tych znaków. Sprawdzanie zgodności z ciągami znaków UTF-8 należy przeprowadzać pakiet oprogramowania po pakiecie (zobacz #Adoption poniżej.) Istnieje eksperymentalna metoda zaproponowana przez IETF, dzięki której poczta e-mail może zostać w jakiś sposób obniżona do starszego formatu all-ASCII, który jest obsługiwany przez wszystkie standardowe serwery poczty e-mail. Ta propozycja została uznana za zbyt uciążliwą; znaczenie lewej części adresu e-mail jest lokalne dla serwera docelowego, więc nie ma możliwości sprawdzenia, czy xn-- coś
jest prawidłową nazwą użytkownika, używaną w jakiejś domenie. Został później przestarzały w 2012 roku.
Ramy norm
Zestaw internetowych dokumentów RFC RFC 6530, RFC 6531, RFC 6532 i RFC 6533, wszystkie opublikowane w lutym 2012 r., definiuje mechanizmy i rozszerzenia protokołów potrzebne do pełnej obsługi międzynarodowych adresów e-mail. Zmiany te obejmują SMTP i rozszerzenie składni nagłówków wiadomości e-mail w celu uwzględnienia danych UTF-8. Zestaw dokumentów zawiera również omówienie kluczowych założeń i problemów związanych z wdrażaniem w pełni umiędzynarodowionej poczty e-mail.
Przyjęcie
- 2013-11-14: Nietoperz! Klient poczty e-mail zaimplementował obsługę międzynarodowych nazw domen (IDN) w adresach e-mail.
- 2014-07-15: Program pocztowy Postfix zaczął obsługiwać międzynarodową pocztę e-mail, znaną również jako EAI lub SMPUTF8 , zdefiniowaną w RFC 6530 .. RFC 6533. Wstępne wsparcie zostało udostępnione w wersji rozwojowej 20140715, a 2015-02-08 zakończyło się w stabilna wersja 3.0.0. Obsługuje UTF-8 w adresach nadawcy SMTP lub LMTP, adresach odbiorców i wartościach nagłówka wiadomości.
- 2014-07-19: XgenPlus Email Server zaczął obsługiwać pocztę e-mail opartą na IDN, znaną również jako obsługa SMPUTF8 , szczególnie dla domeny .भारत.
- 2014-08-05: Firma Google ogłosiła, że Gmail będzie rozpoznawał adresy zawierające znaki akcentowane lub znaki spoza alfabetu łacińskiego, a wkrótce pojawi się większa obsługa internacjonalizacji. Ich dostawcy poczty (MX MTA) ogłaszają wsparcie dla rozszerzenia SMTP dla międzynarodowej poczty e-mail (SMTPUTF8, RFC 6531).
- 2014-09-30: Message Systems ogłosiło, że ich produkt Momentum (wersje 4.1 i 3.6.5) zapewnia obsługę SMTPUTF8 , rozszerzenia internacjonalizacji adresów e-mail do protokołu SMTP, umożliwiającego wysyłanie wiadomości e-mail do nowych adresatów spoza Zachodu.
- wydano wersję 2.10.0 filtru treści poczty Amavis , która dodała obsługę SMPUTF8 , EAI i IDN .
- 2016-12-07: почта.рус Uruchamia w pełni rosyjską (cyrylicę) pocztę e-mail w Moskwie podczas konferencji prasowej.
- Główny minister Vasundhara Raje z Radżastanu uruchomił jedną domenę bezpłatnego adresu e-mail @rajasthan.in i @राजस्थान.भारत 3 grudnia 2017 r. Stan Radżastan stał się pierwszym stanem na świecie, który udostępnia każdemu obywatelowi adres e-mail w jego własnym języku.
- 2016-10-18: Firma Data Xgen Technologies uruchomiła bezpłatny językowy adres e-mail pod nazwą „DATAMAIL”. W ramach wsparcia dla Indii Cyfrowych spowodowało to zatrzymanie indyjskiej aplikacji e-mail obsługującej IDN ( międzynarodową nazwę domeny ) w języku hindi (हिन्दी), gudżarati (ગુજરાતી), urdu (اردو), pendżabskim (ਪੰਜਾਬੀ ਦੇ), tamilskim (த மிழ்), Telgu (తెలుగు ), bengalski (বাংলা), marathi (मराठी), łaciński angielski. DATAMAIL uruchomił języki międzynarodowe dla krajów, w których językiem podstawowym jest arabski (العَرَبِيَّة), rosyjski (русский) i chiński (汉语/漢語).
- 2017-03-07: Apple App Store zatwierdza publikację aplikacji na iOS z obsługą EAI.
- 2017-12-27: Firma Microsoft ogłasza nadchodzącą obsługę poczty e-mail IDN w usłudze Office 365, a także ogłasza partnera XgenPlus obsługującego skrzynki pocztowe IDN.
- 2018-01-03: Microsoft dodaje internacjonalizację poczty e-mail do Exchange Online.
- 2018-09-18: Courier-MTA udostępnia obsługę wiadomości e-mail Unicode, w UTF-8, dla wszystkich paczek Courier. Ponadto Courier-IMAP używa Unicode (UTF8) dla nazw folderów maildir.
- 2020-07-29: DataMail uruchomił adres e-mail w języku kannada, aby przełamać barierę językową