Dowiedz się o rozpoznawaniu znaków optycznych w Microsoft Purview (podgląd)

Opłata za użycie OCR wynosi 1 USD.00 na każde 1000 zeskanowanych przedmiotów. Każdy obraz zeskanowany liczy się jako jedna transakcja. Oznacza to, że samodzielne obrazy (JPEG, JPG, PNG, BMP lub TIFF) liczą się jako pojedyncza transakcja. To też oznacza każda strona W pliku PDF jest ładowane osobno. Na przykład, jeśli w pliku PDF jest 10 stron, skan OCR pliku PDF liczy się jako 10 osobnych skanów.

Streszczenie

W tym artykule dowiemy się o optycznym rozpoznawaniu znaków (OCR) w Microsoft Proview (podgląd) i jego strukturze cenowej. Skanowanie OCR jest opcjonalną funkcją, która umożliwia skanowanie treści w obrazach w poszukiwaniu poufnych informacji. Po włączeniu możesz skonfigurować ustawienia OCR i zastosować istniejące zasady dotyczące zapobiegania utratę danych, zarządzanie rekordami i zarządzanie ryzykiem poufnym na obrazy i treści tekstowe.

Kluczowe punkty

1. Skanowanie OCR w Microsoft Purview umożliwia skanowanie treści w obrazach w poszukiwaniu poufnych informacji.

2. Skanowanie OCR jest opcjonalną funkcją, którą należy włączyć na poziomie najemcy.

3. Możesz wybrać lokalizacje, w których chcesz skanować obrazy, w tym Exchange, SharePoint, OneDrive, zespoły i urządzenia z systemem Windows.

4. Ustawienia OCR pozwalają zastosować istniejące zasady dotyczące zapobiegania utratę danych, zarządzanie rejestrami i zarządzanie ryzykiem poufnym na obrazie i treści tekstowe.

5. Opłata za użycie OCR wynosi 1 USD.00 na każde 1000 zeskanowanych przedmiotów.

6. Każdy obraz zeskanowany liczy się jako jedna transakcja.

7. Samodzielne obrazy (JPEG, JPG, PNG, BMP lub TIFF) liczą się jako pojedyncza transakcja.

8. Każda strona w pliku PDF jest ładowana osobno. Na przykład 10-stronicowy plik PDF liczy się jako 10 osobnych skanów.

9. Wymiana i zespoły można domyślnie skonfigurować dla OCR. Aby włączyć OCR dla SharePoint, OneDrive i urządzenia, zarejestruj się na podanym linku.

10. Przepływ pracy w zakresie włączania OCR obejmuje utworzenie subskrypcji Azure (w razie potrzeby), konfigurację fakturowania Pay-as-You-Go i konfigurację ustawień skanowania OCR.

Pytania i odpowiedzi

1. Czym jest skanowanie rozpoznawania znaków optycznych (OCR) w Microsoft?

Skanowanie OCR w Microsoft Purview umożliwia skanowanie treści w obrazach w poszukiwaniu poufnych informacji. Jest to opcjonalna funkcja, którą należy włączyć na poziomie najemcy.

2. Które lokalizacje można skonfigurować w celu skanowania OCR w Microsoft Proview?

Możesz skonfigurować Exchange, SharePoint, OneDrive, zespoły i urządzenia z systemem Windows do skanowania OCR w Microsoft Perview.

3. Jak obliczane są opłaty za stosowanie OCR?

Opłata za użycie OCR wynosi 1 USD.00 na każde 1000 zeskanowanych przedmiotów. Każdy obraz zeskanowany liczy się jako jedna transakcja, a samodzielne obrazy (JPEG, JPG, PNG, BMP lub TIFF) liczą się jako pojedyncza transakcja. Każda strona w pliku PDF jest ładowana osobno.

4. Są wymiany i zespoły już skonfigurowane dla OCR?

Tak, wymiana i zespoły są już skonfigurowane dla OCR domyślnie. Aby włączyć OCR dla SharePoint, OneDrive i urządzeń, musisz się zarejestrować za pomocą dostarczonego linku.

5. Jakie są warunki korzystania z skanowania OCR w Microsoft Proview?

Wymagania wstępne do korzystania z skanowania OCR w Microsoft Perview obejmują subskrypcję Azure Pay-As-You-Go. Jeśli nie, globalny administrator musi to skonfigurować.

6. Jak mogę skonfigurować rozliczenie dla OCR w Microsoft Proview?

Aby umożliwić OCR, Twój globalny admin. Szczegółowe instrukcje można znaleźć w podanym linku.

7. Jak mogę oszacować mój rachunek za korzystanie z OCR w Microsoft Outview?

Możesz zacząć od ograniczenia użytkowania do kilku użytkowników i obowiązujących obciążeń. Po krótkim czasie możesz zobaczyć swój rachunek w Azure i zobaczyć statystyki użytkowania i opłaty za każdy dzień. Tag „obciążenia” w zarządzaniu kosztami platformy Azure może pomóc Ci zobaczyć awarię użytkowania na obciążenie pracą.

8. Jak mogę skonfigurować ustawienia OCR w Microsoft Perview?

Aby skonfigurować ustawienia OCR w Microsoft Purview, przejdź do portalu Microsoft Proview Compliance i przejdź do sekcji „Ustawienia”. Stamtąd wybierz „Optyczne rozpoznawanie znaków (OCR) (podgląd)”, aby wprowadzić ustawienia konfiguracji OCR.

9. Czy skanowanie OCR może wykryć znaki na zdjęciach dla wszystkich poufnych typów informacji i klasyfikatorów do wyszkolenia?

Tak, gdy OCR jest włączony, wszystkie poufne typy informacji i treningowe klasyfikatory mogą wykrywać znaki, które są na zdjęciach.

10. Co się stanie, gdy obraz zawiera wiele stron?

Gdy obraz zawiera wiele stron, każda strona jest liczona jako osobny skan. Na przykład, jeśli w pliku PDF jest 10 stron, skan OCR pliku PDF liczy się jako 10 osobnych skanów.

11. Które zasady są stosowane do obrazów i treści tekstowych podczas skanowania OCR w Microsoft Proview?

Podczas skanowania OCR w Microsoft Purview istniejące zasady dotyczące zapobiegania utratę danych, zarządzanie rekordami i zarządzanie ryzykiem poufnym są stosowane do obrazów i treści tekstowych.

12. Czy mogę obejrzeć mój rachunek za korzystanie z OCR w Microsoft Proview?

Tak, możesz wyświetlić rachunek, postępując zgodnie z instrukcjami opisanymi w dokumencie „Monitor swój Microsoft Syntex.

13. Czy mogę skonfigurować zakres skanowania OCR w różnych lokalizacjach i rozwiązaniach?

Tak, możesz zdefiniować zakres (użytkowników/grupy/witryny) do skanowania OCR w różnych lokalizacjach i roztworach w ustawieniach konfiguracji OCR.

14. Czy skanowanie OCR jest dostępne dla wszystkich typów plików w Microsoft?

Skanowanie OCR jest dostępne dla samodzielnych obrazów (JPEG, JPG, PNG, BMP lub TIFF), a także plików PDF.

15. Czy skanowanie OCR może wykryć numery kart kredytowych zarówno w tekście, jak i obrazach?

Tak, jeśli skonfigurowałeś warunek zapobiegania utratę danych (DLP) dla numerów kart kredytowych i uwzględnił ją jako poufny typ informacji, skanowanie OCR w Microsoft Proview może wykryć numery kart kredytowych zarówno w tekście, jak i obrazach.


Dowiedz się o rozpoznawaniu znaków optycznych w Microsoft Purview (podgląd)

Opłata za użycie OCR wynosi 1 USD.00 na każde 1000 zeskanowanych przedmiotów. Każdy obraz zeskanowany liczy się jako jedna transakcja. Oznacza to, że samodzielne obrazy (JPEG, JPG, PNG, BMP lub TIFF) liczą się jako pojedyncza transakcja. To też oznacza każda strona W pliku PDF jest ładowane osobno. Na przykład, jeśli w pliku PDF jest 10 stron, skan OCR pliku PDF liczy się jako 10 osobnych skanów.

Czy Office 365 ma OCR?

Оjed

Ыы зарегистрир John. С помощю этой страницы ыы сожем оRipееделить, что запросы оRтравляете имено ыы, а не роvert. Почем это могло пRроизойиS?

Эта страница отображается тех слччаях, когда автоматическими системамgz которые наршают усовия исполззования. Страница перестанеura. До этого момента для исползования слжжж Google неоtoś.

Источником запросов может слжить ведоносное по, подкbarów. ыылку заRzy. Еarag ы исползеете общий доступ и интернет, проблема может ыть с компюююеyn с таким жж жж жесом, кк у комszczeюююе000. Обратитеunks к соем системном адинистратору. Подроlit.

Проверка по слову может также появаятьenia, еaсли ы водите сложные ззапры, оind обычно enia оиизи инenia оtoś еами, или же водите заlektora.

Dowiedz się o rozpoznawaniu znaków optycznych w Microsoft Purview (podgląd)

Optyczne rozpoznawanie znaków (OCR) Umożliwia Microsoft Perview skanowanie treści w obrazach w poszukiwaniu poufnych informacji. Opcjonalna funkcja, skanowanie OCR jest najpierw włączone na poziomie najemcy. Po włączeniu wybierasz lokalizacje, w których chcesz skanować obrazy. Skanowanie obrazów jest dostępne dla Exchange, SharePoint, OneDrive, zespoły i urządzeń Windows. Po skonfigurowaniu ustawień OCR twoje istniejące zasady dotyczące zapobiegania utratę danych (DLP), zarządzania rekordami i zarządzania ryzykiem wrażeń (IRM) są stosowane do obrazów i treści tekstowych. Na przykład powiedz, że skonfigurowałeś warunek DLP Treść zawiera poufne informacje i zawierał klasyfikator danych, taki jak typ informacyjny „karty kredytowej” (SIT). W takim przypadku Microsoft Perview skanuje liczbę numerów kart kredytowych zarówno w tekście, jak i obrazach we wszystkich wybranych lokalizacjach.

Domyślnie wymiana i zespoły można skonfigurować dla OCR. Aby włączyć OCR dla SharePoint, OneDrive i urządzeń, Podpisz tutaj.

Przepływ pracy na pierwszy rzut oka

Faza Co jest potrzebne
Faza 1: W razie potrzeby utwórz subskrypcję Azure Jeśli Twoja organizacja nie ma jeszcze subskrypcji Azure Pay-As-You-Go dla najemcy, Twój globalny admin.
Faza 2: Skonfiguruj fakturowania pay-as-you-go, aby umożliwić OCR. Twój administrator globalny lub sharePoint musi postępować zgodnie z instrukcjami w skonfigurowaniu fakturowania Microsoft Syntex w Azure, aby dodać subskrypcję dla OCR.
Faza 3: Skonfiguruj ustawienia skanowania OCR Administrator zgodności Twojej organizacji konfiguruje ustawienia OCR dla twojego najemcy.

Faza 1: Wymagania wstępne

Aby użyć skanowania OCR, globalny administrator organizacji musi sprawdzić, czy istnieje subskrypcja Azure Pay-As-You-Go. Jeśli nie, muszą to skonfigurować, zgodnie z instrukcjami w tworzeniu początkowych subskrypcji Azure

Faza 2: Konfiguruj rozliczenie

Kiedy włączysz OCR, wszystkie poufne typy informacji i szkolone klasyfikatory mogą wykrywać znaki na zdjęciach.

Ponieważ jest to funkcja opcjonalna, twój globalny administrator musi skonfigurować faktury Pay-as-You-Go, aby włączyć OCR. Patrz instrukcje w skonfigurowaniu fakturowania Microsoft Syntex w Azure, aby dodać subskrypcję dla OCR.

Po przejściu na stronę fakturowania Microsoft Syntex, aby zarejestrować się w subskrypcji OCR, robisz to nie Musisz również zarejestrować się w Microsoft Syntex.

Informacje o cenach Pay-As-you-y w OCR można znaleźć na stronie Microsoft Syntex na stronie Azure.

Opłaty

Opłata za użycie OCR wynosi 1 USD.00 na każde 1000 zeskanowanych przedmiotów. Każdy obraz zeskanowany liczy się jako jedna transakcja. Oznacza to, że samodzielne obrazy (JPEG, JPG, PNG, BMP lub TIFF) liczą się jako pojedyncza transakcja. To też oznacza każda strona W pliku PDF jest ładowane osobno. Na przykład, jeśli w pliku PDF jest 10 stron, skan OCR pliku PDF liczy się jako 10 osobnych skanów.

Aby wyświetlić rachunek, postępuj zgodnie z instrukcjami opisanymi w Monitor Your Microsoft Syntex Pay-As-You-Go Użycie.

Oszacuj swój rachunek

Kiedy zaczniesz używać OCR, ogranicz użycie tylko kilku osób i obowiązujące obciążenia. Po krótkim czasie możesz zobaczyć swój rachunek w Azure i zobaczyć statystyki i opłaty za użytkowanie na każdy dzień. Stamtąd możesz ekstrapolować koszty pełnego zestawu użytkowników. Ponadto możesz użyć znacznika „obciążenia” w zarządzaniu kosztami platformy Azure, aby zobaczyć podział użytkowania na obciążenie pracą.

Faza 3: Skonfiguruj ustawienia OCR

  1. W portalu Microsoft Proview Compliance przejdź do Ustawienia.
  2. Wybierać Rozpoznawanie znaków optycznych (OCR) (podgląd) Aby wprowadzić ustawienia konfiguracji OCR.
  3. Wybierz lokalizacje, w których chcesz skanować obrazy. Następnie dla każdej lokalizacji i rozwiązania zdefiniuj zakres (użytkowników/grupy/witryny) dla OCR. Obsługiwane lokalizacje i rozwiązania są wymienione w poniższej tabeli.

Informacje na temat funkcjonalności OCR w Microsoft Proview Communication Compliance, patrz Utwórz i zarządzaj zasadami zgodności komunikacyjnej.

Lokalizacja Obsługiwane rozwiązania
Giełda Zapobieganie utracie danych 1

Zarządzanie ryzykiem poufnym 3

1 obsługuje tylko wychodzące e -maile.
2 obsługuje słowa kluczowe i poufne typy informacji.
3 Rozważa poufne typy informacji i treningowe klasyfikatory obecne na zdjęciach w celu oceny ryzyka.

Jakie typy plików są obsługiwane?

Ta funkcjonalność obsługuje skanowanie obrazów w następujących typach plików, z odnotowanymi wymaganiami:

  • Obsługiwane są tylko obrazy z tekstem maszynowym.
  • Tylko obrazy przesłane po włączeniu OCR są skanowane.
  • Tylko samodzielne obrazy są skanowane.
  • SharePoint i OneDrive obsługuje tylko następujące typy plików: JPEG, JPG, PNG i BMP.
  • Wskazówki dotyczące zasad zapobiegania utratę danych nie są obsługiwane dla obrazów w zamian.
  • Skanowanie obrazów w plikach skompresowanych/archiwum nie jest obsługiwane.
  • Jeśli wykluczysz ścieżkę w ustawieniach zapobiegania utratę danych końcowych, OCR nie skanuje obrazów w tych folderach.
  • Gdy OCR jest włączony dla urządzeń Windows, urządzenia zaczynają wysyłać wiadomości do chmury w celu skanowania. Domyślny limit przepustowości to 1024 MB danych na urządzenie dziennie. OCR zatrzymuje skanowanie obrazów po osiągnięciu tego dziennego limitu. Jeśli chcesz kontynuować skanowanie obrazów, możesz zwiększyć limit przepustowości.

Jakie języki są obsługiwane?

Skanowanie OCR obsługuje ponad 150 języków.

Streszczenie

  • Możesz zasubskrybować skanowanie OCR bez subskrypcji Microsoft Syntex.
  • Konfigurowanie OCR występuje na poziomie najemcy, więc po skonfigurowaniu OCR są one dostępne dla całego stosu Microsoft Perview.
  • Nie musisz tworzyć osobnych klasyfikatorów danych dla OCR. Po skonfigurowaniu OCR, istniejące wrażliwe typy informacji, dokładne dopasowanie danych wrażliwych typów informacji, klasyfikatory, klasyfikatory i odciski palców Skanuje obrazy, a także dokumenty i e -maile.

Zobacz też

  • Dowiedz się o zapobieganiu utracie danych
  • Dowiedz się o zarządzaniu ryzykiem poufnym
  • Dowiedz się o zarządzaniu rekordami

Informacja zwrotna

Prześlij i przeglądaj informacje zwrotne dla

Beau Cameron

W ubiegłym roku w IGNITE, Microsoft ogłosił zdolność OCR za pomocą “Technologia wizji komputerowej” przyjedzie do Office 365! To wywołało wiele emocji, ponieważ była to cecha, którą wiele osób chce od lat! Microsoft opublikował artykuł w TechCommunity o nowym postępie w inteligentnym wyszukiwaniu za pomocą OCR, który można znaleźć tutaj. Cóż, z przyjemnością stwierdzam, że istnieje i na pewno jest niesamowity!

Obsługiwane typy

Zgodnie z powyższym artykułem TechCommunity, obsługiwane typy “BMP”, “png”, “JPEG”, “jpg”, “Gif”, “tif”, “sprzeczka”, “surowy”, i również “arw”, “CR2”, “CRW”, “erf”, “Mef”, “MRW”, “Nef”, “NRW”, “orf”, “pef”, “RW2”, “RW1”, “SR2”.

Aby przetestować tę funkcję, przesłałem makieta w celu uzyskania dodatku do biurka pomocy, który zbudowałem dla Office 365 do biblioteki dokumentów.

Zgłoszenie serwisowe

JPG wygląda tak

Helpdesk

Ty’Zauważ, że wewnątrz obrazu są wyśmiewane 4 bilety z odrobiną bekonu ipsum. Tytuły biletów są “Problem z SharePoint”, “Komputer nie działa”, “Nie ma problemu z po prostu przywitanie” I “Problem z SharePoint” Ponownie. Moim planem przetestowania OCR jest wyszukiwanie zawartości tego tytułu za pomocą wyszukiwania SharePoint!

Test: Wyszukaj wartości biletów

Mój pierwszy test będzie próbował znaleźć jeden z oznaczonych biletów “Problem z SharePoint” i spójrz na wyniki! Nie tylko pasuje do wartości na obrazie, ale’S również odbiera inne wartości biletów.

Wynik wyszukiwania

Nie powinno być zaskoczeniem, że kiedy szukam niektórych opisów biletów, powinny one również powrócić w wynikach wyszukiwania. I’VE postanowił przeszukać pierwsze zdanie opisu w makiecie. Oto wynik!

SearchResult2Czy to też działa we współczesności?

W moich poprzednich przykładach korzystałem z SharePoint Classic Search. Jeśli zastanawiałeś się, czy to działa również w nowoczesnym wyszukiwaniu, założysz się!

ModernSearchJak to działa?

Domyślam się, że OCR w SharePoint używa usług multimedialnych Azure do konwersji treści tekstowej w plikach cyfrowych na tekst cyfrowy. Powodem przyjęcia jest to z następującej konwencji nazewnictwa używanego w SharePoint.

Ilekroć SharePoint znajduje tekst w twoich obrazach, wartości są przechowywane w pozycji w dziedzinie o nazwie MediaServiceoct. Spójrz na odpowiedź JSON z zapytania o pozycję listy.

MediaServiceocr

Nie byłem’możliwość znalezienia domyślnej nieruchomości zarządzanej dla tego pola, ale to jest’T jest ogromnym problemem, ponieważ SharePoint automatycznie tworzy pełzaną właściwość o nazwie OWS_MediaserviceOcr. Korzystając z tej pełzanej właściwości, mogę tworzyć wszystkie zarządzane mapowania nieruchomości, które chcę.

Crawled.png

Kilka komentarzy

OCR PDF mają rodzime wsparcie w Office 365. Jednak zeskanowane dokumenty, które są obecnie PDF’T Generowanie wartości w kolumnie MediaServiceOcr. I’testowałem tę funkcjonalność bez sukcesu – jeszcze.

Zauważyłem pewne niespójności z funkcją OCR. Przetestowałem to w wielu bibliotekach i zauważyłem, że to nie’tworzyłem wartości mediaServiceOcr na niektórych elementach (czyn’t istnieją). I’LL Informuj Cię, gdy znajdę więcej informacji na ten temat.

Microsoft Information Ochrona: optyczne rozpoznawanie znaków (OCR) w Exchange Online i Teams DLP

Optyczne rozpoznawanie znaków (OCR) Obsługuje wyodrębnienie tekstu z obrazów i pomoże odkryć i chronić poufne dane na obrazach udostępnianych w Exchange Online (EXO), a także zasad zapobiegania stratom danych zespołów (DLP).
Data podglądu: Czerwiec Cy2022

Produkt Ochrona informacji Microsoft
Faza uwalniania Zapowiedź
Data wydania Na
Platforma Sieć
Instancja w chmurze Na całym świecie (standardowy multi -nant)
Utworzony 2022-04-14
Identyfikator mapy drogowej 88860
Link mapy drogowej https: // www.Microsoft.COM/Microsoft-365/Mapa?FequeID = 88860

Udostępnij to:

  • Kliknij, aby udostępnić na Twitterze (otwiera się w nowym oknie)
  • Kliknij, aby udostępnić na Facebooku (otwiera się w nowym oknie)
  • Kliknij, aby udostępnić w Google+ (otwiera się w nowym oknie)