Add multilingual audit CI pipeline + extract mandelblog_content_guard
This commit is contained in:
24
mandelblog_content_guard/normalizers/it.py
Normal file
24
mandelblog_content_guard/normalizers/it.py
Normal file
@@ -0,0 +1,24 @@
|
||||
from __future__ import annotations
|
||||
|
||||
import re
|
||||
|
||||
|
||||
IT_LINE_REPLACEMENTS = {
|
||||
"Richiedi un piano di supporto Mostra i progetti Unverbindliches Gespräch, klares Angebot Realizziamo siti web e negozi online veloci che il tuo team può gestire in autonomia.": "Richiedi un piano di supporto · Mostra i progetti · Colloquio senza impegno con proposta chiara. Realizziamo siti web e negozi online veloci che il tuo team può gestire in autonomia.",
|
||||
"Dopo il colloquio iniziale Obiettivi chiari e tappe Planificación clara Transparente Investition Nome * Email * Azienda * Dettagli del progetto Richiedi un piano di supporto Pronto a iniziare con supporto e crescita?": "Dopo il colloquio iniziale Obiettivi chiari e tappe Pianificazione chiara Investimento trasparente Nome * Email * Azienda * Dettagli del progetto Richiedi un piano di supporto Pronto a iniziare con supporto e crescita?",
|
||||
"Mehrsprachiger Rollout-Plan Anpassung & Integrationen Integrazioni API, flussi di lavoro specifici e blocchi personalizzati adattati alla sua azienda.": "Piano di lancio multilingue Personalizzazioni e integrazioni Integrazioni API, flussi di lavoro specifici e blocchi personalizzati adattati alla sua azienda.",
|
||||
}
|
||||
|
||||
IT_PHRASE_REPLACEMENTS = {
|
||||
"Planificación clara": "Pianificazione chiara",
|
||||
"Unverbindliches Gespräch, klares Angebot": "Colloquio senza impegno con proposta chiara",
|
||||
}
|
||||
|
||||
|
||||
def normalize_it_text(text: str, field_path: str = "") -> str:
|
||||
if text in IT_LINE_REPLACEMENTS:
|
||||
return IT_LINE_REPLACEMENTS[text]
|
||||
cleaned = text
|
||||
for source, target in sorted(IT_PHRASE_REPLACEMENTS.items(), key=lambda item: len(item[0]), reverse=True):
|
||||
cleaned = cleaned.replace(source, target)
|
||||
return re.sub(r"\s+", " ", cleaned).strip()
|
||||
Reference in New Issue
Block a user