Zezwala się na korzystanie, kopiowanie lub modyfikowanie poniższych baz i ich dokumentacji wyłącznie w celach edukacyjnych i badawczych, bez opłat, pod warunkiem, że ta informacja o prawach autorskich oraz nazwiska oryginalnych autorów pojawią się na wszystkich kopiach i dokumentacji uzupełniającej. Bazy danych nie mogą być modyfikowane bez uprzedniej pisemnej zgody jej twórców. Autorzy nie ponoszą odpowiedzialności i nie składają żadnych oświadczeń na temat przydatności tych baz danych do jakichkolwiek celów, są one dostarczane w aktualnym stanie bez wyraźnej lub dorozumianej gwarancji.
WEZUT OCR Datasets
Baza WEZUT OCR Dataset ver. 1.00 zawiera 176 obrazów przedstawiających fotografie nierównomiernie oświetlonych dokumentów uzyskane za pomocą cyfrowego aparatu fotograficznego DSLR Nikon N70 wraz z referencyjnym plikiem tekstowym 00_GT.txt zawierającym często używany w celach demonstracyjnych tekst "Lorem ipsum". Obrazy przedstawiają zdjęcia dokumentów sporządzonych i wydrukowanych z użyciem pięciu popularnych krojów czcionek (Arial, Times New Roman, Calibri, Courier oraz Verdana) wraz z typowymi modyfikacjami atrybutów (tekst normalny, pogrubiony, pochylony oraz ich kombinacja).
Baza została utworzona na Wydziale Elektrycznym (WE) Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie (ZUT). Jej autorzy (Hubert Michalak oraz Krzysztof Okarma) prowadzą badania naukowe w Katedrze Przetwarzania Sygnałów i Inżynierii Multimedialnej (KPSiIM). Głównym celem opracowania bazy jest ewaluacja algorytmów binaryzacji obrazów, opracowywanych w celu przetwarzania wstępnego nierównomiernie oświetlonych obrazów dokumentów poddawanych następnie operacji rozpoznawania tekstu z użyciem oprogramowania OCR.
W przypadku publikowania wyników uzyskanych za pomocą bazy WEZUT OCR Dataset prosimy o odniesienie się do jednego lub kilku spośród następujących artykułów (opublikowanych w modelu Open Access):
- Michalak H., Okarma K.: Robust combined binarization method of non-uniformly illuminated document images for alphanumerical character recognition. Sensors, vol. 20 no. 10, article no. 2914, 2020, DOI: 10.3390/s20102914, (plik BIBTeX)
- Michalak H., Okarma K.: Improvement of image binarization methods using image preprocessing with local entropy filtering for alphanumerical character recognition purposes. Entropy, vol. 21 no. 6, article no. 562, 2019, DOI: 10.3390/e21060562, (plik BIBTeX)
- Michalak H., Okarma K.: Fast binarization of unevenly illuminated document images based on background estimation for optical character recognition purposes. Journal of Universal Computer Science, vol. 25 no. 6, pp. 627-646, 2019, DOI: 10.3217/jucs-025-06-062, (plik BIBTeX)
Baza do pobrania (plik ZIP - 85.5 MB)
Alternatywny link na stronie DIB na serwerze Centro de Informática (CIn), Universidade Federal de Pernambuco (UFPE), Brazylia
Baza WEZUT Video OCR Dataset ver. 1.00 zawiera 20 nierównomiernie oświetlonych sekwencji wideo zarejestrowanych za pomocą cyfrowej kamery Olympus Tough TG-5 12 MPix ze stabilizacją Multi-motion Movie IS. Poszczególne klatki sekwencji wideo przedstawiają dokumenty zawierające ten sam często używany w celach demonstracyjnych tekst "Lorem ipsum". Baza została podzielona na dwie części: 12 plików zarejestrowanych w typowych warunkach z nierównomiernym oświetleniem oraz 8 sekwencji wideo zawierających widoczne cienie.
Baza została utworzona na Wydziale Elektrycznym (WE) Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie (ZUT). Jej autorzy (Piotr Lech oraz Krzysztof Okarma) prowadzą badania naukowe w Katedrze Przetwarzania Sygnałów i Inżynierii Multimedialnej (KPSiIM). Głównym celem opracowania bazy jest ewaluacja algorytmów binaryzacji oraz oceny jakości obrazów, opracowywanych w celu przetwarzania wstępnego nierównomiernie oświetlonych obrazów dokumentów poddawanych następnie operacji rozpoznawania tekstu z użyciem oprogramowania OCR.
W przypadku publikowania wyników uzyskanych za pomocą bazy WEZUT Video OCR Dataset prosimy o odniesienie się do następującego artykułu (opublikowanego w modelu Open Access):
- Okarma K., Lech P.: A method supporting fault-tolerant optical text recognition from video sequences recorded with handheld cameras. Engineering Applications of Artificial Intelligence, vol. 123 Part B, article no. 106330, 2023, DOI: 10.1016/j.engappai.2023.106330, (plik BIBTeX)
Baza do pobrania (plik ZIP - 1.27 GB)
WEZUT 3DPrint Quality Dataset
WEZUT 3DPrint Quality Dataset ver. 1.00 zawiera 107 obrazów oraz 107 map głębokości pozyskanych dla płaskich próbek o rozmiarze 35 mm × 35 mm × 4 mm odpowiednio za pomocą aparatu Sony DSC-HX100V w kontrolowanych warunkach oświetleniowych oraz skanera 3D GOM ATOS. Wszystkie próbki zostały wydrukowane z użyciem popularnych drukarek 3D bazujących na technologii FDM, takich jak Prusa i3, RepRap Ormerod 3 oraz da Vinci 1.0 Pro 3-in-1, z dwóch powszechnie używanych rodzajów filamentu: PLA oraz ABS o różnych kolorach materiału. Rozmiar pozyskanych obrazów za pomocą kamery bez flasha dla czasu ekspozycji 1/125 s oraz ogniskowej 5 mm z automatycznym balansem bieli wynosi 1600 × 1600 pikseli.
Integralną częścią bazy jest zestaw ocen eksperckich wyrażonych w 4-punktowej skali (dobra - 1, umiarkowanie dobra - 4, umiarkowanie niska - 6, oraz niska jakość - 10), a także uśrednione wyniki ocen subiektywnych (Mean Opinion Scores – MOS) uzyskane w wyniku eksperymentów percepcyjnych przeprowadzonych w grupie kilkudziesięciu niezależnych obserwatorów wyrażone w skali od 1 do 5. Wartości MOS, zweryfikowane jako zgodne z ocenami eksperckimi, zostały użyte jako odniesienie przy opracowaniu oraz optymalizacji wskaźników do automatycznej oceny jakości w celu maksymalizacji ich korelacji z ocenami subiektywnymi.
Niniejsza baza została utworzona na Wydziale Elektrycznym (WE) Zachodniopomorskieog Uniwersytetu Technologicznego w Szczecinie (ZUT). Autorzy (Jarosław Fastowicz, Mateusz Tecław oraz Krzysztof Okarma) są pracownikami Katedry Przetwarzania Sygnałów i Inżynierii Multimedialnej (KPSiIM).
Baza jest przeznaczona głównie do weryfikacji wskaźników jakości powierzchni wydruków 3D bazujących na analizie obrazów, opracowanych w celu kontroli jakości wydruków 3D z użyciem kamer zlokalizowanych bocznie, co umożliwia obserwowanie procesu wydruku z widocznymi poszczególnymi wasrtwami filamentu. Is it intended mainly for the evaluation of image-based quality assessment methods of 3D printed surfaces,
Zezwala się na korzystanie, kopiowanie lub modyfikowanie poniższych baz i ich dokumentacji wyłącznie w celach edukacyjnych i badawczych, bez opłat, pod warunkiem, że ta informacja o prawach autorskich oraz nazwiska oryginalnych autorów pojawią się na wszystkich kopiach i dokumentacji uzupełniającej. Bazy danych nie mogą być modyfikowane bez uprzedniej pisemnej zgody jej twórców. Autorzy nie ponoszą odpowiedzialności i nie składają żadnych oświadczeń na temat przydatności tych baz danych do jakichkolwiek celów, są one dostarczane w aktualnym stanie bez wyraźnej lub dorozumianej gwarancji.
W przypadku publikowania wyników uzyskanych za pomocą bazy WEZUT 3DPrint Quality Dataset prosimy o odniesienie się do jednego lub kilku spośród następujących artykułów (opublikowanych głównie w modelu Open Access):
- Okarma K., Fastowicz J,. Lech P., Lukin V.: Quality assessment of 3D printed surfaces using combined metrics based on mutual Structural Similarity approach correlated with subjective aesthetic evaluation. Applied Sciences, vol. 10 no. 18, article no. 6248, 2020, DOI: 10.3390/app10186248 (BIBTeX citation data)
- Okarma K., Fastowicz J.: Improved quality assessment of colour surfaces for additive manufacturing based on image entropy. Pattern Analysis and Applications, vol. 23 no. 3, pp. 1035-1047, 2020, DOI: 10.1007/s10044-020-00865-w 10.1007/s10044-020-00865-w (BIBTeX citation data)
- Fastowicz J., Lech P., Okarma K.: Combined metrics for quality assessment of 3D printed surfaces for aesthetic purposes: towards higher accordance with subjective evaluations. Lecture Notes in Computer Science, vol. 12143 (ICCS'2020), pp. 326-339, Springer, 2020, DOI: 10.1007/978-3-030-50436-6_24 (BIBTeX citation data)
- Okarma K., Fastowicz J.: Adaptation of full-reference image quality assessment methods for automatic visual evaluation of the surface quality of 3D prints. Elektronika Ir Elektrotechnika, vol. 25 no. 5, pp. 57-62, 2019, DOI: 10.5755/j01.eie.25.5.24357 10.5755/j01.eie.25.5.24357 (BIBTeX citation data)
- Fastowicz J., Okarma K.: Quality assessment of photographed 3D printed flat surfaces using Hough transform and histogram equalization. Journal of Universal Computer Science, vol. 25 no. 6, pp. 701-717, 2019, DOI: 10.3217/jucs-025-06-0701 (BIBTeX citation data)
- Fastowicz J., Grudziński M., Tecław M., Okarma K.: Objective 3D printed surface quality assessment based on entropy of depth maps. Entropy, vol. 21 no. 1, article no. 97, 2019, DOI: 10.3390/e21010097 (BIBTeX citation data)
WEZUT 3D Print Quality Dataset file for download (ZIP - 672 MB)