Streamlit_OCR_comparator

Sleeping

App Files Files Community

Loren commited on Jan 2, 2024

Commit

031bfc0

1 Parent(s): 1731090

Update app_pages/ocr_comparator.py

Browse files

Files changed (1) hide show

app_pages/ocr_comparator.py +10 -6

app_pages/ocr_comparator.py CHANGED Viewed

@@ -626,9 +626,6 @@ def app():
         ##
         # Create results data frame
-        print("list_text_easyocr : ", list_text_easyocr)
-        print("list_text_ppocr : ", list_text_ppocr)
-        print("lens : ", len(list_cropped_images))
         out_df_results = pd.DataFrame({'cropped_image': list_cropped_images,
                                     'text_easyocr': list_text_easyocr,
                                     'confidence_easyocr': list_confidence_easyocr,
@@ -665,7 +662,8 @@ def app():
         ## ------- EasyOCR Text recognition
         try:
             step = 0*len(in_list_images) # first recognition process
-            nb_steps = 4 * len(in_list_images)
             for ind_img, cropped in enumerate(in_list_images):
                 result = _in_reader_easyocr.recognize(cropped, **in_params)
                 try:
@@ -702,7 +700,8 @@ def app():
         try:
             reader_ppocr = PaddleOCR(**in_params)
             step = 1*len(in_list_images) # second recognition process
-            nb_steps = 4 * len(in_list_images)
             progress_bar = st.progress(step/nb_steps)
             for ind_img, cropped in enumerate(in_list_images):
@@ -778,7 +777,8 @@ def app():
         """
         ## ------- Tesseract Text recognition
         step = 3*in_nb_images # fourth recognition process
-        nb_steps = 4 * in_nb_images
         progress_bar = st.progress(step/nb_steps)
         try:
@@ -874,6 +874,10 @@ def app():
             column_width = 400
             for ind_lig in range(0, reco_lines+1, 2):
                 cols = st.columns(2)
                 for ind_col in range(2):
                     ind = ind_lig + ind_col
                     if ind < len(in_reader_type_list):

         ##
         # Create results data frame
         out_df_results = pd.DataFrame({'cropped_image': list_cropped_images,
                                     'text_easyocr': list_text_easyocr,
                                     'confidence_easyocr': list_confidence_easyocr,
         ## ------- EasyOCR Text recognition
         try:
             step = 0*len(in_list_images) # first recognition process
+            #nb_steps = 4 * len(in_list_images)
+            nb_steps = 3 * len(in_list_images)
             for ind_img, cropped in enumerate(in_list_images):
                 result = _in_reader_easyocr.recognize(cropped, **in_params)
                 try:
         try:
             reader_ppocr = PaddleOCR(**in_params)
             step = 1*len(in_list_images) # second recognition process
+            #nb_steps = 4 * len(in_list_images)
+            nb_steps = 3 * len(in_list_images)
             progress_bar = st.progress(step/nb_steps)
             for ind_img, cropped in enumerate(in_list_images):
         """
         ## ------- Tesseract Text recognition
         step = 3*in_nb_images # fourth recognition process
+        #nb_steps = 4 * in_nb_images
+        nb_steps = 3 * in_nb_images
         progress_bar = st.progress(step/nb_steps)
         try:
             column_width = 400
             for ind_lig in range(0, reco_lines+1, 2):
                 cols = st.columns(2)
+                # test
+                cols[0].markdown('col 0')
+                cols[1].markdown('col 1')
+                #
                 for ind_col in range(2):
                     ind = ind_lig + ind_col
                     if ind < len(in_reader_type_list):