¿Cómo transferir contenido de Wayback Machine (archive.org) a Wordpress?

Publicado por: 2019-12-04

Al usar la opción "Extraer contenido estructurado", puede crear fácilmente un blog de Wordpress tanto desde el sitio que se encuentra en el Archivo Web como desde cualquier otro sitio. Para hacer esto, primero busque el sitio fuente y luego en la herramienta Restaurar un sitio web o Descargar un sitio web marque la opción "Extraer contenido estructurado". Ingrese sus opciones (correo electrónico, marcas de tiempo, etc.) y comience a descargar.


Cuando se completa el proceso de descarga de un sitio web, el sistema lo implementa en nuestro servidor y comienza a extraer contenido. Durante la creación de un archivo de artículos, nuestro analizador solo tiene en cuenta el contenido significativo, excluyendo artículos duplicados, controles y páginas de servicio, dejando solo artículos con formato guardado listos para importar a su sitio web. Una vez completado el proceso de extracción de artículos, recibirá una carta de confirmación, ábrala y descargue el contenido: el botón "Artículos (.zip)".


El archivo zip contiene el contenido extraído en varios formatos, de ellos seleccione un archivo con la extensión .wxr. En su sitio web de Wordpress, inicie la importación de contenido - (En el panel de administración de Wordpress - Herramientas - Importar - Wordpress - Iniciar importación).


Si el contenido extraído tiene algunas imágenes, los enlaces se incluirán en el archivo del artículo. Para importarlos a su sitio de Wordpress necesita usar nuestro plugin Archivarix External Images Importer. En la pestaña del complemento "Configuración de descarga" puede establecer el parámetro "Iniciar descarga" en "Inmediatamente". Significa que al importar un archivo con artículos, el complemento descargará inmediatamente todas las imágenes externas a la galería multimedia de Wordpress. Si tiene muchas imágenes, puede usar la importación en segundo plano: en la misma pestaña, seleccione "Poner en cola" y luego haga clic en el botón "Ejecutar procesamiento en segundo plano". Después de un tiempo, todos los archivos multimedia disponibles se importarán a su sitio.

El uso de materiales de artículos está permitido solo si se publica el enlace a la fuente: https://es.archivarix.com/blog/convert-archiveorg-to-wordpress/

Últimas noticias:
2020.01.23
¡Otra mega actualización de Archivarix CMS!

Se agregaron herramientas muy útiles que permiten hacer clic en un botón:
- limpiar todos los enlaces internos rotos,
- eliminar imágenes faltantes,
- establece rel = "nofollow" para todos los enlaces externos.

Ahora se puede importar una recuperación adicional directamente desde el propio CMS. Puede combinar diferentes recuperaciones en un solo sitio de trabajo.

Para aquellos que trabajan con sitios grandes o usan un alojamiento deficiente, todas las acciones que anteriormente podrían detenerse en el tiempo de espera de su alojamiento ahora se dividirán en partes y continuarán automáticamente hasta que se completen. ¿Quieres hacer un reemplazo en el código de 500 mil archivos? Importar varios gigabytes de recuperación? Todo esto ahora es posible en cualquier alojamiento, incluso muy barato. El tiempo de espera (por defecto, 30 segundos) se puede cambiar en el parámetro ACMS_TIMEOUT.

Nuestro cargador (index.php) ahora funciona en los protocolos http y https, independientemente de los parámetros de compilación. Puede forzar el protocolo cambiando el valor del parámetro ARCHIVARIX_PROTOCOL.
2020.01.07
La próxima actualización de Archivarix CMS con la incorporación de nuevas funcionalidades. Ahora cualquier sitio antiguo se puede convertir correctamente a UTF-8 con el clic de un botón. El filtrado de búsqueda se ha vuelto aún mejor, porque Ahora los resultados se pueden filtrar por tipo MIME.
2019.12.20
Hemos lanzado la tan esperada actualización de Archivarix CMS. En la nueva versión, además de varias mejoras y optimizaciones, hay una característica muy útil para el filtrado adicional de resultados de búsqueda y soporte completo para la estructura de árbol de URL para recuperaciones con una gran cantidad de archivos. Se pueden encontrar más detalles en el registro de cambios al script Archivarix CMS .
2019.11.27
Se ha lanzado nuestro complemento Importador de imágenes externas de Archivarix, que importa imágenes de sitios web de terceros, cuyos enlaces se encuentran en publicaciones y páginas, a la galería de WordPress. Si la imagen no está disponible o eliminada actualmente, el complemento descarga una copia del archivo web.
2019.11.20
Hemos agregado una nueva sección de nuestro sitio: Blog Archivarix . Allí puede leer información útil sobre el funcionamiento de nuestro sistema y sobre la restauración de sitios de Archive.org.