Przypomnij sobie
Deweloperzy | Jean-François Dockes |
---|---|
Wersja stabilna | 1.31.0 / 7 marca 2022
|
Magazyn | |
Napisane w | C++ i Pythona |
System operacyjny | Podobny do systemu Unix , Windows , OS/2 |
Typ | Narzędzie wyszukiwania |
Licencja | GPL |
Strona internetowa |
Recoll to narzędzie do wyszukiwania na pulpicie , które zapewnia wyszukiwanie pełnotekstowe (od pojedynczych słów do dowolnie złożonych wyszukiwań boolowskich) w graficznym interfejsie użytkownika z kilkoma obowiązkowymi zależnościami zewnętrznymi. Działa pod wieloma systemami operacyjnymi typu Unix i jest w większości niezależny od środowiska graficznego . Recoll został przeniesiony do systemu OS/2 i planowana jest integracja z systemem ArcaOS opartym na systemie OS/2 .
Recoll został zaprojektowany tak, aby nie wymagał stałego demona , w systemach Linux może korzystać z inotify . Recoll aktualizuje swój indeks w określonych odstępach czasu (na przykład poprzez cronjobs ), ale w razie potrzeby zadanie indeksowania może działać jako demon monitorowania systemu plików w celu aktualizacji indeksu w czasie rzeczywistym.
Cechy
- GUI Qt .
- Zaplecze Xapian .
- Indeksuje zawartość wielu typów dokumentów: tekst, HTML , magazyny e-mail wszelkiego rodzaju, OpenDocument , Microsoft Office i Office Open XML , AbiWord , KWord , Gaim , Lyx , Scribus , PDF , WordPerfect , PostScript , RTF , TeX , DVI , DjVu , MP3 i inne formaty plików audio, JPEG i inne formaty plików graficznych.
- Rekurencyjnie przetwarza osadzone dokumenty ( załączniki do wiadomości e-mail , archiwa ZIP ) do dowolnej głębokości.
- Funkcje zapytań, z wyszukiwaniem boolowskim, symbolami wieloznacznymi, frazami, bliskością i filtrowaniem według typów plików i drzew katalogów. Narzędzie do budowania wyszukiwania logicznego GUI.
- Obsługa języka zapytań Xesam.
- Tworzenie rdzeni słów jest wykonywane w czasie zapytania (można zmienić język tworzenia rdzeni po indeksowaniu).
- Wiele indeksów do wyboru w czasie zapytania (tj. indeksy osobiste + systemowe).
- Natywnie oparty na Unicode. Obsługuje wiele języków i zestawów znaków, w tym dobrą obsługę tekstów wschodnioazjatyckich ( CJK ).
- MD5 dokumentów w celu wyeliminowania duplikatów w wynikach.
- Tryby indeksowania wsadowego i w czasie rzeczywistym.
- API Pythona .
- powłoki GNOME , interfejs WEB i rozszerzenia historii Firefoksa .
Obsługiwany typ pliku
Typy plików indeksowane natywnie
- Tekst.
- HTML.
- Maildir, MH i skrzynka pocztowa (poczta Mozilla, Thunderbird i Evolution ok). Uwaga dotycząca ewolucji: pamiętaj o usunięciu pliku .cache z listy pomijanych nazw w panelu Preferencje indeksowania GUI/Parametry lokalne/, jeśli chcesz indeksować lokalne kopie poczty Imap.
- Pliki dziennika Gaim i Purple.
- Pliki Scribusa.
- Strony podręcznika (potrzebny Groff).
- Format archiwum internetowego Mimehtml (obsługa oparta na filtrze poczty, który wprowadza pewną łagodną dziwność, ale nadal jest użyteczny).
- Wszystkie poniższe wymagają Python3:
- Diagramy.
- Excel i PowerPoint (pre-open-XML).
- Archiwa tar. Indeksowanie plików tar jest domyślnie wyłączone (ponieważ archiwa tar zazwyczaj nie zawierają tego rodzaju dokumentów, których ludzie szukają), musisz je jawnie włączyć, na przykład w pliku $HOME/.recoll/mimeconf:
[indeks] application/x-tar = execm rcltar
- Archiwa ZIP.
- Format archiwum sieciowego Konquerora (wykorzystuje standardowy moduł biblioteczny Pythona tarfile).
Typy plików indeksowane za pomocą zewnętrznych pomocników
- Pliki PDF.
- Pliki MS-Word.
- Pliki Wordperfekcyjne.
- Pliki RTF.
- Znaczniki plików graficznych i dźwiękowych.
- Pliki Abiworda.
- Ebooki Fb2, Epub i CHM.
- Pliki Kword.
- Tradycyjne i otwarte pliki Microsoft Office XML.
- Pliki OpenOffice.
- Pliki SVG.
- Pliki adnotacji Okulara.
- Pliki HWP (bez numeracji stron).