sillsdev
diff --git a/‎machine/corpora/__init__.py
Lines changed: 12 additions & 8 deletions b/‎machine/corpora/__init__.py
Lines changed: 12 additions & 8 deletions
diff --git a/‎machine/corpora/analysis/__init__.py
Lines changed: 3 additions & 0 deletions b/‎machine/corpora/analysis/__init__.py
Lines changed: 3 additions & 0 deletions
diff --git a/‎machine/corpora/analysis/quote_convention.py
Lines changed: 14 additions & 0 deletions b/‎machine/corpora/analysis/quote_convention.py
Lines changed: 14 additions & 0 deletions
diff --git a/‎machine/corpora/basic_quotation_mark_resolver.py renamed to ‎machine/corpora/fallback_quotation_mark_resolver.py
Lines changed: 1 addition & 1 deletion b/‎machine/corpora/basic_quotation_mark_resolver.py renamed to ‎machine/corpora/fallback_quotation_mark_resolver.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎machine/corpora/quotation_denormalization_first_pass.py
Lines changed: 3 additions & 76 deletions b/‎machine/corpora/quotation_denormalization_first_pass.py
Lines changed: 3 additions & 76 deletions
diff --git a/‎machine/corpora/quotation_denormalization_usfm_update_block_handler.py
Lines changed: 5 additions & 141 deletions b/‎machine/corpora/quotation_denormalization_usfm_update_block_handler.py
Lines changed: 5 additions & 141 deletions
@@ -2,12 +2,12 @@
 from .alignment_collection import AlignmentCollection
 from .alignment_corpus import AlignmentCorpus
 from .alignment_row import AlignmentRow
-from .basic_quotation_mark_resolver import BasicQuotationMarkResolver
 from .corpora_utils import batch
 from .corpus import Corpus
 from .dbl_bundle_text_corpus import DblBundleTextCorpus
 from .dictionary_alignment_corpus import DictionaryAlignmentCorpus
 from .dictionary_text_corpus import DictionaryTextCorpus
+from .fallback_quotation_mark_resolver import FallbackQuotationMarkResolver
 from .file_paratext_project_settings_parser import FileParatextProjectSettingsParser
 from .file_paratext_project_text_updater import FileParatextProjectTextUpdater
 from .flatten import flatten
@@ -25,11 +25,13 @@
 from .paratext_project_text_updater_base import ParatextProjectTextUpdaterBase
 from .paratext_text_corpus import ParatextTextCorpus
 from .place_markers_usfm_update_block_handler import PlaceMarkersAlignmentInfo, PlaceMarkersUsfmUpdateBlockHandler
-from .quotation_denormalization_action import QuotationDenormalizationAction
 from .quotation_denormalization_first_pass import QuotationDenormalizationFirstPass
-from .quotation_denormalization_resolution_settings import QuotationDenormalizationResolutionSettings
-from .quotation_denormalization_settings import QuotationDenormalizationSettings
 from .quotation_denormalization_usfm_update_block_handler import QuotationDenormalizationUsfmUpdateBlockHandler
+from .quotation_mark_update_first_pass import QuotationMarkUpdateFirstPass
+from .quotation_mark_update_resolution_settings import QuotationMarkUpdateResolutionSettings
+from .quotation_mark_update_settings import QuotationMarkUpdateSettings
+from .quotation_mark_update_strategy import QuotationMarkUpdateStrategy
+from .quote_convention_changing_usfm_update_block_handler import QuoteConventionChangingUsfmUpdateBlockHandler
 from .scripture_element import ScriptureElement
 from .scripture_ref import EMPTY_SCRIPTURE_REF, ScriptureRef
 from .scripture_ref_usfm_parser_handler import ScriptureRefUsfmParserHandler, ScriptureTextType
@@ -87,7 +89,7 @@
     "AlignmentCollection",
     "AlignmentCorpus",
     "AlignmentRow",
-    "BasicQuotationMarkResolver",
+    "FallbackQuotationMarkResolver",
     "batch",
     "Corpus",
     "create_versification_ref_corpus",
@@ -123,11 +125,13 @@
     "PlaceMarkersAlignmentInfo",
     "PlaceMarkersUsfmUpdateBlockHandler",
     "parse_usfm",
-    "QuotationDenormalizationAction",
+    "QuoteConventionChangingUsfmUpdateBlockHandler",
+    "QuotationMarkUpdateResolutionSettings",
+    "QuotationMarkUpdateStrategy",
+    "QuotationMarkUpdateFirstPass",
     "QuotationDenormalizationFirstPass",
     "QuotationDenormalizationUsfmUpdateBlockHandler",
-    "QuotationDenormalizationResolutionSettings",
-    "QuotationDenormalizationSettings",
+    "QuotationMarkUpdateSettings",
     "RtlReferenceOrder",
     "ScriptureElement",
     "ScriptureRef",
 
@@ -7,6 +7,7 @@
 from .quotation_mark_resolution_settings import QuotationMarkResolutionSettings
 from .quotation_mark_resolver import QuotationMarkResolver
 from .quotation_mark_string_match import QuotationMarkStringMatch
+from .quotation_mark_tabulator import QuotationMarkCounts, QuotationMarkTabulator
 from .quote_convention import QuoteConvention, SingleLevelQuoteConvention
 from .quote_convention_detection_resolution_settings import QuoteConventionDetectionResolutionSettings
 from .quote_convention_detector import QuoteConventionAnalysis, QuoteConventionDetector
@@ -20,6 +21,7 @@
     "Chapter",
     "DepthBasedQuotationMarkResolver",
     "SingleLevelQuoteConvention",
+    "QuotationMarkCounts",
     "QuotationMarkDirection",
     "QuotationMarkMetadata",
     "QuotationMarkStringMatch",
@@ -30,6 +32,7 @@
     "QuotationMarkResolutionIssue",
     "QuotationMarkResolutionSettings",
     "QuotationMarkResolver",
+    "QuotationMarkTabulator",
     "QuoteConventionDetector",
     "QuoteConventionSet",
     "TextSegment",
 
@@ -48,6 +48,20 @@ def __init__(self, name: str, levels: list[SingleLevelQuoteConvention]):
         self.name = name
         self.levels = levels
 
+    def __eq__(self, value):
+        if not isinstance(value, QuoteConvention):
+            return False
+        if self.name != value.name:
+            return False
+        if len(self.levels) != len(value.levels):
+            return False
+        for level, other_level in zip(self.levels, value.levels):
+            if level.get_opening_quote() != other_level.get_opening_quote():
+                return False
+            if level.get_closing_quote() != other_level.get_closing_quote():
+                return False
+        return True
+
     def get_name(self) -> str:
         return self.name
 
 
@@ -8,7 +8,7 @@
 from .analysis.quotation_mark_string_match import QuotationMarkStringMatch
 
 
-class BasicQuotationMarkResolver(QuotationMarkResolver):
+class FallbackQuotationMarkResolver(QuotationMarkResolver):
 
     def __init__(self, settings: QuotationMarkResolutionSettings):
         self._settings: QuotationMarkResolutionSettings = settings
 
@@ -1,81 +1,8 @@
-from typing import Dict, List, Set
-
-from .analysis.chapter import Chapter
-from .analysis.depth_based_quotation_mark_resolver import DepthBasedQuotationMarkResolver
-from .analysis.quotation_mark_finder import QuotationMarkFinder
-from .analysis.quotation_mark_resolution_issue import QuotationMarkResolutionIssue
-from .analysis.quotation_mark_resolver import QuotationMarkResolver
-from .analysis.quotation_mark_string_match import QuotationMarkStringMatch
 from .analysis.quote_convention import QuoteConvention
-from .analysis.quote_convention_set import QuoteConventionSet
-from .analysis.usfm_structure_extractor import UsfmStructureExtractor
-from .quotation_denormalization_action import QuotationDenormalizationAction
-from .quotation_denormalization_resolution_settings import QuotationDenormalizationResolutionSettings
+from .quotation_mark_update_first_pass import QuotationMarkUpdateFirstPass
 
 
-class QuotationDenormalizationFirstPass(UsfmStructureExtractor):
+class QuotationDenormalizationFirstPass(QuotationMarkUpdateFirstPass):
 
     def __init__(self, source_quote_convention: QuoteConvention, target_quote_convention: QuoteConvention):
-        super().__init__()
-        self._quotation_mark_finder: QuotationMarkFinder = QuotationMarkFinder(
-            QuoteConventionSet([source_quote_convention.normalize()])
-        )
-        self._quotation_mark_resolver: QuotationMarkResolver = DepthBasedQuotationMarkResolver(
-            QuotationDenormalizationResolutionSettings(source_quote_convention, target_quote_convention)
-        )
-        self._will_basic_denormalization_work: bool = self._check_whether_basic_denormalization_will_work(
-            source_quote_convention, target_quote_convention
-        )
-
-    def _check_whether_basic_denormalization_will_work(
-        self, source_quote_convention: QuoteConvention, target_quote_convention: QuoteConvention
-    ) -> bool:
-        normalized_source_quote_convention: QuoteConvention = source_quote_convention.normalize()
-        target_marks_by_normalized_source_marks: Dict[str, Set[str]] = {}
-        for level in range(1, normalized_source_quote_convention.get_num_levels() + 1):
-            normalized_opening_quotation_mark = normalized_source_quote_convention.get_opening_quote_at_level(level)
-            if normalized_opening_quotation_mark not in target_marks_by_normalized_source_marks:
-                target_marks_by_normalized_source_marks[normalized_opening_quotation_mark] = set()
-            if level <= target_quote_convention.get_num_levels():
-                target_marks_by_normalized_source_marks[normalized_opening_quotation_mark].add(
-                    target_quote_convention.get_closing_quote_at_level(level)
-                )
-
-        for normalized_source_mark in target_marks_by_normalized_source_marks:
-            if len(target_marks_by_normalized_source_marks[normalized_source_mark]) > 1:
-                return False
-        return True
-
-    def get_best_actions_by_chapter(self) -> List[QuotationDenormalizationAction]:
-        best_actions_by_chapter: List[QuotationDenormalizationAction] = []
-
-        for chapter in self.get_chapters():
-            best_actions_by_chapter.append(self._find_best_action_for_chapter(chapter))
-
-        return best_actions_by_chapter
-
-    def _find_best_action_for_chapter(self, chapter: Chapter) -> QuotationDenormalizationAction:
-        quotation_mark_matches: List[QuotationMarkStringMatch] = (
-            self._quotation_mark_finder.find_all_potential_quotation_marks_in_chapter(chapter)
-        )
-
-        self._quotation_mark_resolver.reset()
-
-        # use list() to force evaluation of the generator
-        list(self._quotation_mark_resolver.resolve_quotation_marks(quotation_mark_matches))
-
-        return self._choose_best_action_based_on_observed_issues(self._quotation_mark_resolver.get_issues())
-
-    def _choose_best_action_based_on_observed_issues(self, issues) -> QuotationDenormalizationAction:
-        if QuotationMarkResolutionIssue.AMBIGUOUS_QUOTATION_MARK in issues:
-            return QuotationDenormalizationAction.SKIP
-
-        if (
-            QuotationMarkResolutionIssue.UNPAIRED_QUOTATION_MARK in issues
-            or QuotationMarkResolutionIssue.TOO_DEEP_NESTING in issues
-        ):
-            if self._will_basic_denormalization_work:
-                return QuotationDenormalizationAction.APPLY_BASIC
-            return QuotationDenormalizationAction.SKIP
-
-        return QuotationDenormalizationAction.APPLY_FULL
+        super().__init__(source_quote_convention.normalize(), target_quote_convention)
@@ -1,150 +1,14 @@
-from typing import List, Union
-
-from .analysis.depth_based_quotation_mark_resolver import DepthBasedQuotationMarkResolver
-from .analysis.quotation_mark_finder import QuotationMarkFinder
-from .analysis.quotation_mark_resolver import QuotationMarkResolver
-from .analysis.quotation_mark_string_match import QuotationMarkStringMatch
 from .analysis.quote_convention import QuoteConvention
-from .analysis.quote_convention_set import QuoteConventionSet
-from .analysis.text_segment import TextSegment
-from .analysis.usfm_marker_type import UsfmMarkerType
-from .basic_quotation_mark_resolver import BasicQuotationMarkResolver
-from .quotation_denormalization_action import QuotationDenormalizationAction
-from .quotation_denormalization_resolution_settings import QuotationDenormalizationResolutionSettings
-from .quotation_denormalization_settings import QuotationDenormalizationSettings
-from .usfm_token import UsfmToken, UsfmTokenType
-from .usfm_update_block import UsfmUpdateBlock
-from .usfm_update_block_element import UsfmUpdateBlockElement, UsfmUpdateBlockElementType
-from .usfm_update_block_handler import UsfmUpdateBlockHandler
+from .quotation_mark_update_settings import QuotationMarkUpdateSettings
+from .quote_convention_changing_usfm_update_block_handler import QuoteConventionChangingUsfmUpdateBlockHandler
 
 
-class QuotationDenormalizationUsfmUpdateBlockHandler(UsfmUpdateBlockHandler):
+class QuotationDenormalizationUsfmUpdateBlockHandler(QuoteConventionChangingUsfmUpdateBlockHandler):
 
     def __init__(
         self,
         source_quote_convention: QuoteConvention,
         target_quote_convention: QuoteConvention,
-        settings: QuotationDenormalizationSettings = QuotationDenormalizationSettings(),
+        settings: QuotationMarkUpdateSettings = QuotationMarkUpdateSettings(),
     ):
-        super().__init__()
-        self._source_quote_convention: QuoteConvention = source_quote_convention
-        self._target_quote_convention: QuoteConvention = target_quote_convention
-        self._settings: QuotationDenormalizationSettings = settings
-
-        self._quotation_mark_finder: QuotationMarkFinder = QuotationMarkFinder(
-            QuoteConventionSet([self._source_quote_convention.normalize()])
-        )
-        self._next_scripture_text_segment_builder: TextSegment.Builder = TextSegment.Builder()
-
-        resolution_settings = QuotationDenormalizationResolutionSettings(
-            self._source_quote_convention, self._target_quote_convention
-        )
-
-        # Each embed represents a separate context for quotation marks
-        # (i.e. you can't open a quote in one context and close it in another)
-        # so we need to keep track of the verse and embed contexts separately.
-        self._verse_text_quotation_mark_resolver: DepthBasedQuotationMarkResolver = DepthBasedQuotationMarkResolver(
-            resolution_settings
-        )
-        self._embed_quotation_mark_resolver: DepthBasedQuotationMarkResolver = DepthBasedQuotationMarkResolver(
-            resolution_settings
-        )
-        self._simple_quotation_mark_resolver: BasicQuotationMarkResolver = BasicQuotationMarkResolver(
-            resolution_settings
-        )
-        self._current_denormalization_action = QuotationDenormalizationAction.APPLY_FULL
-        self._current_chapter_number: int = 0
-        self._current_verse_number: int = 0
-
-    def process_block(self, block: UsfmUpdateBlock) -> UsfmUpdateBlock:
-        self._check_for_chapter_change(block)
-        self._check_for_verse_change(block)
-        if self._current_denormalization_action is QuotationDenormalizationAction.SKIP:
-            return block
-        if self._current_denormalization_action is QuotationDenormalizationAction.APPLY_BASIC:
-            return self._apply_simple_denormalization(block)
-        return self._apply_full_denormalization(block)
-
-    def _apply_simple_denormalization(self, block: UsfmUpdateBlock) -> UsfmUpdateBlock:
-        for element in block._elements:
-            self._process_scripture_element(element, self._simple_quotation_mark_resolver)
-        return block
-
-    def _apply_full_denormalization(self, block: UsfmUpdateBlock) -> UsfmUpdateBlock:
-        for element in block._elements:
-            if element.type == UsfmUpdateBlockElementType.EMBED:
-                self._embed_quotation_mark_resolver.reset()
-                self._process_scripture_element(element, self._embed_quotation_mark_resolver)
-            else:
-                self._process_scripture_element(element, self._verse_text_quotation_mark_resolver)
-
-        return block
-
-    def _process_scripture_element(
-        self, element: UsfmUpdateBlockElement, quotation_mark_resolver: QuotationMarkResolver
-    ) -> None:
-        text_segments: List[TextSegment] = self._create_text_segments(element)
-        quotation_mark_matches: List[QuotationMarkStringMatch] = (
-            self._quotation_mark_finder.find_all_potential_quotation_marks_in_text_segments(text_segments)
-        )
-        for resolved_quotation_mark in quotation_mark_resolver.resolve_quotation_marks(quotation_mark_matches):
-            resolved_quotation_mark.update_quotation_mark(self._target_quote_convention)
-
-    def _create_text_segments(self, element: UsfmUpdateBlockElement) -> List[TextSegment]:
-        text_segments: List[TextSegment] = []
-        for token in element.get_tokens():
-            if token.type == UsfmTokenType.VERSE:
-                self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.VerseMarker)
-            elif token.type == UsfmTokenType.PARAGRAPH:
-                self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.ParagraphMarker)
-            elif token.type == UsfmTokenType.CHARACTER:
-                self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.CharacterMarker)
-            elif token.type == UsfmTokenType.NOTE:
-                self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.EmbedMarker)
-            elif token.type == UsfmTokenType.TEXT:
-                text_segment: Union[TextSegment, None] = self._create_text_segment(token)
-                if text_segment is not None:
-                    text_segments.append(text_segment)
-        return self._set_previous_and_next_for_segments(text_segments)
-
-    def _create_text_segment(self, token: UsfmToken) -> Union[TextSegment, None]:
-        self._next_scripture_text_segment_builder.set_usfm_token(token)
-        if token.text is not None:
-            self._next_scripture_text_segment_builder.set_text(token.text)
-            text_segment_to_return: TextSegment = self._next_scripture_text_segment_builder.build()
-            self._next_scripture_text_segment_builder = TextSegment.Builder()
-            return text_segment_to_return
-        else:
-            self._next_scripture_text_segment_builder = TextSegment.Builder()
-
-    def _set_previous_and_next_for_segments(self, text_segments: List[TextSegment]) -> List[TextSegment]:
-        for i in range(len(text_segments)):
-            if i > 0:
-                text_segments[i].set_previous_segment(text_segments[i - 1])
-            if i < len(text_segments) - 1:
-                text_segments[i].set_next_segment(text_segments[i + 1])
-        return text_segments
-
-    def _check_for_chapter_change(self, block: UsfmUpdateBlock) -> None:
-        for scripture_ref in block.refs:
-            if scripture_ref.chapter_num != self._current_chapter_number:
-                self._current_chapter_number = scripture_ref.chapter_num
-                self._start_new_chapter(self._current_chapter_number)
-
-    def _start_new_chapter(self, new_chapter_number: int) -> None:
-        self._current_denormalization_action = self._settings.get_action_for_chapter(new_chapter_number)
-        self._verse_text_quotation_mark_resolver.reset()
-        self._next_scripture_text_segment_builder = TextSegment.Builder()
-        self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.ChapterMarker)
-
-    def _check_for_verse_change(self, block: UsfmUpdateBlock) -> None:
-        for scripture_ref in block.refs:
-            if (
-                scripture_ref.chapter_num == self._current_chapter_number
-                and scripture_ref.verse_num != self._current_verse_number
-            ):
-                self._current_verse_number = scripture_ref.verse_num
-                self._start_new_verse(self._current_verse_number)
-
-    def _start_new_verse(self, new_chapter_number: int) -> None:
-        self._next_scripture_text_segment_builder.add_preceding_marker(UsfmMarkerType.VerseMarker)
+        super().__init__(source_quote_convention.normalize(), target_quote_convention, settings)