Expresiones regulares utilizadas en Archivarix CMS

Publicado por: 2020-02-06

Este artículo describe expresiones regulares usadas para buscar y reemplazar contenido en sitios web restaurados usando el Sistema Archivarix. No son exclusivos de este sistema. Si conoce las expresiones regulares de PHP, Perl, Java u otros lenguajes de programación, entonces ya sabe cómo usar nuestra búsqueda y reemplazo. 

Las expresiones regulares son un lenguaje formal para encontrar y manipular subcadenas en el texto, basadas en el uso de metacaracteres. Para la búsqueda, se utiliza una plantilla que consta de caracteres y metacaracteres y define una regla de búsqueda. Para la manipulación de texto, también se especifica una cadena de reemplazo adicional, que también puede contener caracteres especiales.

Aquí está el constructor de expresiones regulares en línea, que le permite crear y probar expresiones regulares usando una interfaz simple: https://regexr.com/

La lista de expresiones regulares utilizadas:

[abc] Un solo carácter: a, b, c
[^ abc] Cualquier carácter individual excepto a, b, c
[az] Cualquier carácter individual en el rango az
[a-zA-Z] Cualquier carácter individual en el rango az o AZ
^ Inicio de línea
$ Fin de línea
\ A Inicio de cadena
\ z Fin de cadena
. Cualquier personaje
\ s Cualquier carácter de espacio en blanco
\ S Cualquier carácter que no sea un espacio en blanco
\ d Cualquier dígito
\ D Cualquier no dígito
\ w Cualquier carácter de palabra (letra, número, guión bajo)
\ W Cualquier carácter que no sea de palabra
\ b Cualquier carácter de límite de palabra
(...) Capture todo lo incluido
(a | b) a o b
a? Cero o uno de un
a * Cero o más de a
a + Uno o más de a
a {3} Exactamente 3 de un
a {3,} 3 o más de un
a {3,6} entre 3 y 6 de un

El uso de materiales de artículos está permitido solo si se publica el enlace a la fuente: https://es.archivarix.com/blog/regex/

Últimas noticias:
2020.05.21
Una actualización que los estudios web y aquellos que usan outsourcing apreciarán.
- Contraseña separada para el modo seguro.
- Modo seguro extendido. Ahora puede crear reglas y archivos personalizados, pero sin código ejecutable.
- Reinstalar el sitio desde el CMS sin tener que eliminar manualmente nada del servidor.
- Posibilidad de ordenar reglas personalizadas.
- Búsqueda y reemplazo mejorados para sitios muy grandes.
- Configuraciones adicionales para la herramienta "Metaetiqueta de ventana gráfica".
- Soporte para dominios IDN en hosting con la versión anterior de ICU.
- En la instalación inicial con una contraseña, se agrega la capacidad de cerrar sesión.
- Si se detecta .htaccess durante la integración con WP, las reglas de Archivarix se agregarán a su inicio.
- Al descargar sitios por número de serie, CDN se utiliza para aumentar la velocidad.
- Otras mejoras menores y correcciones.
2020.05.12
Nuestro Archivarix CMS se está desarrollando a pasos agigantados. Nueva actualización en la que apareció:
- Nuevo panel de control para ver estadísticas, configuraciones del servidor y actualizaciones del sistema.
- Capacidad para crear plantillas y agregar convenientemente nuevas páginas al sitio.
- Integración con Wordpress y Joomla en un clic.
- Ahora en Búsqueda-Sustitución, se realiza un filtrado adicional como constructor, donde puede agregar cualquier número de reglas.
- Ahora puede filtrar los resultados por dominio / subdominios, fecha-hora, tamaño de archivo.
- Una nueva herramienta para restablecer el caché en Cloudlfare o habilitar / deshabilitar el modo Dev.
- Una nueva herramienta para eliminar versiones en las URL, por ejemplo, "?ver=1.2.3" en css o js. Le permite reparar incluso aquellas páginas que parecían torcidas en el WebArchive debido a la falta de estilos con diferentes versiones.
- La herramienta robots.txt tiene la capacidad de habilitar y agregar inmediatamente un mapa de Sitemap.
- Creación automática y manual de puntos de reversión para cambios.
- Importar puede importar plantillas.
- Guardar / Importar la configuración del cargador contiene los archivos personalizados creados.
- Para todas las acciones que pueden durar más que un tiempo de espera, se muestra una barra de progreso.
- Una herramienta para agregar una metaetiqueta de ventana gráfica a todas las páginas de un sitio.
- Las herramientas para eliminar enlaces e imágenes rotas tienen la capacidad de dar cuenta de los archivos en el servidor.
- Una nueva herramienta para corregir enlaces incorrectos de urlencode en código html. Raramente, pero puede ser útil.
- Herramienta de URL faltantes mejorada. Junto con el nuevo cargador, ahora cuenta las llamadas a URL inexistentes.
- Consejos de expresiones regulares en búsqueda y sustitución.
- Mejora de la comprobación de las extensiones de php faltantes.
- Se actualizaron todas las herramientas js usadas a las últimas versiones.

Esta y muchas otras mejoras cosméticas y optimizaciones de velocidad.
2020.02.14
¡Nuevo viernes, nuevas actualizaciones!
Se hicieron muchas cosas nuevas y útiles en Archivarix CMS:
- En Buscar y reemplazar, ahora puede filtrar por fecha de url.
- Ahora los enlaces externos de todas las páginas del sitio se pueden eliminar con solo hacer clic en un botón. Se conservan las anclas.
- Un nuevo parámetro ACMS_SAFE_MODE, que prohíbe cambiar la configuración del cargador / CMS y cargar archivos personalizados, también está prohibido que las importaciones importen configuraciones y archivos personalizados.
- Los archivos de configuración JSON para el cargador y el CMS ahora se pueden descargar a su computadora y descargar al CMS desde un archivo en la computadora. Por lo tanto, la transferencia de configuraciones a otros sitios se ha vuelto aún más fácil.
- Crear reglas personalizadas se ha vuelto más conveniente, a menudo se usan patrones que puede elegir.
- Se pueden crear nuevos archivos personalizados en el administrador de archivos sin tener que descargar el archivo.
- El árbol de URL para el dominio principal siempre viene primero.
- Si oculta el árbol de URL del dominio / subdominio, esta configuración se guarda mientras trabaja con el CMS.
- En lugar de dos botones, abre / contrae el árbol de URL, ahora uno que puede hacer ambas cosas.
- Se simplificó la creación de una nueva URL y, al crearla, puede especificar inmediatamente el archivo desde la computadora.
- En el diseño móvil, la parte principal de trabajo es lo primero.
- Después de cada manipulación del archivo, su tamaño se actualiza en la base de datos.
- Botones fijos para retrocesos selectivos del historial.
- Se corrigió la creación de nuevas URL para subdominios que contienen números en el nombre de dominio.
2020.02.07
Nueva porción de actualizaciones!
No hay necesidad de cambiar nada en el código fuente de los archivos ahora.
- Ahora puede cargar sitios en el servidor cargando en el servidor solo un script de nuestro CMS Archivarix.
- Para cambiar algo en la configuración de CMS, ya no necesita abrir su código fuente. Puede establecer una contraseña o límites inferiores directamente desde la sección Configuración.
- Para conectar sus contadores, rastreadores, secuencias de comandos personalizadas, ahora se usa una carpeta "incluye" separada dentro de la carpeta .content.xxxxxx. También puede cargar archivos personalizados directamente a través del nuevo administrador de archivos en CMS. Agregar contadores y análisis a todas las páginas del sitio también se ha vuelto conveniente y comprensible.
- Las importaciones admiten una nueva estructura de archivos con configuraciones y la carpeta "incluye".
- Se agregaron atajos de teclado para trabajar en el editor de código.

Estas y muchas otras mejoras en la nueva versión. El cargador también se ha actualizado y funciona con la configuración que crea el CMS.
2020.01.23
¡Otra mega actualización de Archivarix CMS!

Se agregaron herramientas muy útiles que permiten hacer clic en un botón:
- limpiar todos los enlaces internos rotos,
- eliminar imágenes faltantes,
- establece rel = "nofollow" para todos los enlaces externos.

Ahora se puede importar una recuperación adicional directamente desde el propio CMS. Puede combinar diferentes recuperaciones en un solo sitio de trabajo.

Para aquellos que trabajan con sitios grandes o usan un alojamiento deficiente, todas las acciones que anteriormente podrían detenerse en el tiempo de espera de su alojamiento ahora se dividirán en partes y continuarán automáticamente hasta que se completen. ¿Quieres hacer un reemplazo en el código de 500 mil archivos? Importar varios gigabytes de recuperación? Todo esto ahora es posible en cualquier alojamiento, incluso muy barato. El tiempo de espera (por defecto, 30 segundos) se puede cambiar en el parámetro ACMS_TIMEOUT.

Nuestro cargador (index.php) ahora funciona en los protocolos http y https, independientemente de los parámetros de compilación. Puede forzar el protocolo cambiando el valor del parámetro ARCHIVARIX_PROTOCOL.