Expresiones regulares utilizadas en Archivarix CMS

Publicado por: 2020-02-06

Este artículo describe expresiones regulares usadas para buscar y reemplazar contenido en sitios web restaurados usando el Sistema Archivarix. No son exclusivos de este sistema. Si conoce las expresiones regulares de PHP, Perl, Java u otros lenguajes de programación, entonces ya sabe cómo usar nuestra búsqueda y reemplazo. 

Las expresiones regulares son un lenguaje formal para encontrar y manipular subcadenas en el texto, basadas en el uso de metacaracteres. Para la búsqueda, se utiliza una plantilla que consta de caracteres y metacaracteres y define una regla de búsqueda. Para la manipulación de texto, también se especifica una cadena de reemplazo adicional, que también puede contener caracteres especiales.

Aquí está el constructor de expresiones regulares en línea, que le permite crear y probar expresiones regulares usando una interfaz simple: https://regexr.com/

La lista de expresiones regulares utilizadas:

[abc] Un solo carácter: a, b, c
[^ abc] Cualquier carácter individual excepto a, b, c
[az] Cualquier carácter individual en el rango az
[a-zA-Z] Cualquier carácter individual en el rango az o AZ
^ Inicio de línea
$ Fin de línea
\ A Inicio de cadena
\ z Fin de cadena
. Cualquier personaje
\ s Cualquier carácter de espacio en blanco
\ S Cualquier carácter que no sea un espacio en blanco
\ d Cualquier dígito
\ D Cualquier no dígito
\ w Cualquier carácter de palabra (letra, número, guión bajo)
\ W Cualquier carácter que no sea de palabra
\ b Cualquier carácter de límite de palabra
(...) Capture todo lo incluido
(a | b) a o b
a? Cero o uno de un
a * Cero o más de a
a + Uno o más de a
a {3} Exactamente 3 de un
a {3,} 3 o más de un
a {3,6} entre 3 y 6 de un

El uso de materiales de artículos está permitido solo si se publica el enlace a la fuente: https://archivarix.com/es/blog/regex/

Últimas noticias:
2020.11.03
La nueva versión de CMS se ha vuelto más conveniente y comprensible para los webmasters de todo el mundo.

- Localización completa de Archivarix CMS en 13 idiomas (inglés, español, italiano, alemán, francés, portugués, polaco, turco, japonés, chino, ruso, ucraniano, bielorruso).
- Exportar todos los datos del sitio actual a un archivo zip para guardar una copia de seguridad o transferir a otro sitio.
- Mostrar y eliminar archivos zip rotos en herramientas de importación.
- Verificación de la versión de PHP durante la instalación.
- Información para instalar CMS en un servidor con NGINX PHP-FPM.
- En la búsqueda, cuando el modo experto está activado, se muestran la fecha / hora de la página y un enlace a su copia en el WebArchive.
- Mejoras en la interfaz de usuario.
- Optimización de código.

Si eres un hablante nativo en un idioma al que nuestro CMS aún no ha sido traducido, te invitamos a mejorar aún más nuestro producto. A través del servicio Crowdin, puede solicitar y convertirse en nuestro traductor oficial a nuevos idiomas.
2020.10.06
Nueva versión de Archivarix CMS.
- Soporte de interfaz de línea de comando para implementar sitios web directamente desde la línea de comando, importaciones, configuraciones, estadísticas, historial de limpieza y actualizaciones del sistema.
- Soporte para contraseñas encriptadas password_hash (), que se pueden usar en la CLI.
- Modo experto para incluir información adicional de depuración, herramientas experimentales y enlaces directos a instantáneas de WebArchive guardadas.
- Las herramientas para imágenes y enlaces internos rotos ahora pueden devolver una lista de todas las URL que faltan en lugar de eliminarlas.
- La herramienta de importación muestra archivos zip corruptos / incompletos que se pueden eliminar.
- Soporte de cookies mejorado para cumplir con los requisitos de los navegadores modernos.
- Configuración de la opción de editor predeterminada para páginas HTML (editor visual o código).
- La pestaña "Cambios" que muestra las diferencias de texto, deshabilitada de forma predeterminada, se puede habilitar en la configuración.
- Puede volver a un cambio específico en la pestaña "Cambios".
- Se corrigió la URL del mapa del sitio XML para sitios web creados con el subdominio www.
- Se corrigió la eliminación de archivos temporales que se crearon durante la instalación / importación.
- Limpieza más rápida de la historia.
- Se eliminaron las frases de localización no utilizadas.
- Cambio de idioma en la pantalla de inicio de sesión.
- Paquetes externos actualizados a las versiones más recientes.
- Uso optimizado de la memoria para calcular las diferencias de texto en la pestaña Cambios.
- Soporte mejorado para versiones antiguas de la extensión php-dom.
- Una herramienta experimental para corregir el tamaño de los archivos en la base de datos si editó los archivos directamente en el servidor.
- Una herramienta de exportación de diseño plano experimental y muy tosca.
- Soporte experimental de claves públicas para futuras funciones de API.
2020.06.08
La primera actualización de junio de Archivarix CMS con características nuevas y convenientes.
- Solucionado: la sección Historial no funcionaba si la extensión zip php no estaba habilitada.
- Ficha Historial con detalles de cambios al editar archivos de texto.
- Herramienta de edición .htaccess.
- Capacidad para limpiar las copias de seguridad hasta el punto de reversión deseado.
- El bloque "URL faltantes" se ha eliminado de las Herramientas, ya que es accesible desde el panel principal
- Se agregó comprobación y muestra espacio libre en disco en el panel principal.
- Verificación mejorada de las extensiones PHP necesarias en el inicio y la instalación inicial.
- Pequeños cambios cosméticos.
- Todas las herramientas externas actualizadas a las últimas versiones.
2020.05.21
Una actualización que los estudios web y aquellos que usan outsourcing apreciarán.
- Contraseña separada para el modo seguro.
- Modo seguro extendido. Ahora puede crear reglas y archivos personalizados, pero sin código ejecutable.
- Reinstalar el sitio desde el CMS sin tener que eliminar manualmente nada del servidor.
- Posibilidad de ordenar reglas personalizadas.
- Búsqueda y reemplazo mejorados para sitios muy grandes.
- Configuraciones adicionales para la herramienta "Metaetiqueta de ventana gráfica".
- Soporte para dominios IDN en hosting con la versión anterior de ICU.
- En la instalación inicial con una contraseña, se agrega la capacidad de cerrar sesión.
- Si se detecta .htaccess durante la integración con WP, las reglas de Archivarix se agregarán a su inicio.
- Al descargar sitios por número de serie, CDN se utiliza para aumentar la velocidad.
- Otras mejoras menores y correcciones.
2020.05.12
Nuestro Archivarix CMS se está desarrollando a pasos agigantados. Nueva actualización en la que apareció:
- Nuevo panel de control para ver estadísticas, configuraciones del servidor y actualizaciones del sistema.
- Capacidad para crear plantillas y agregar convenientemente nuevas páginas al sitio.
- Integración con Wordpress y Joomla en un clic.
- Ahora en Búsqueda-Sustitución, se realiza un filtrado adicional como constructor, donde puede agregar cualquier número de reglas.
- Ahora puede filtrar los resultados por dominio / subdominios, fecha-hora, tamaño de archivo.
- Una nueva herramienta para restablecer el caché en Cloudlfare o habilitar / deshabilitar el modo Dev.
- Una nueva herramienta para eliminar versiones en las URL, por ejemplo, "?ver=1.2.3" en css o js. Le permite reparar incluso aquellas páginas que parecían torcidas en el WebArchive debido a la falta de estilos con diferentes versiones.
- La herramienta robots.txt tiene la capacidad de habilitar y agregar inmediatamente un mapa de Sitemap.
- Creación automática y manual de puntos de reversión para cambios.
- Importar puede importar plantillas.
- Guardar / Importar la configuración del cargador contiene los archivos personalizados creados.
- Para todas las acciones que pueden durar más que un tiempo de espera, se muestra una barra de progreso.
- Una herramienta para agregar una metaetiqueta de ventana gráfica a todas las páginas de un sitio.
- Las herramientas para eliminar enlaces e imágenes rotas tienen la capacidad de dar cuenta de los archivos en el servidor.
- Una nueva herramienta para corregir enlaces incorrectos de urlencode en código html. Raramente, pero puede ser útil.
- Herramienta de URL faltantes mejorada. Junto con el nuevo cargador, ahora cuenta las llamadas a URL inexistentes.
- Consejos de expresiones regulares en búsqueda y sustitución.
- Mejora de la comprobación de las extensiones de php faltantes.
- Se actualizaron todas las herramientas js usadas a las últimas versiones.

Esta y muchas otras mejoras cosméticas y optimizaciones de velocidad.