Anthropic

De acuerdo con el estándar de la industria, Anthropic utiliza una variedad de fuentes de datos para el desarrollo de modelos, como datos disponibles públicamente en Internet recopilados a través de un rastreador web. Como parte de nuestra misión de construir sistemas de frontera seguros y confiables y avanzar en el campo del desarrollo responsable de IA, compartimos los principios mediante los cuales recopilamos datos, así como instrucciones sobre cómo optar por no participar en nuestro rastreo en el futuro:

Nuestra recopilación de datos debe ser transparente. El Token de Agente de Usuario ClaudeBot identifica el rastreador web de propósito general de Anthropic.

Nuestro rastreo no debe ser intrusivo ni disruptivo. Nuestro objetivo es causar una mínima interrupción siendo cuidadosos sobre la frecuencia con la que rastreamos los mismos dominios y respetando el Crawl-delay cuando sea apropiado.

El rastreador de Anthropic respeta las señales de "no rastrear" honrando las directivas estándar de la industria en robots.txt, incluidas las prohibiciones para el Agente de Usuario <a href="https://commoncrawl.org/ccbot" rel="nofollow noopener noreferrer" target="_blank">CCBot de Common Crawl</a>.

El rastreador de Anthropic respeta las tecnologías anti-elusión (por ejemplo, no intentaremos eludir los CAPTCHAs de los sitios que rastreamos).

- Nuestra recopilación de datos debe ser transparente. El Token de Agente de Usuario ClaudeBot identifica el rastreador web de propósito general de Anthropic.
- Nuestro rastreo no debe ser intrusivo ni disruptivo. Nuestro objetivo es causar una mínima interrupción siendo cuidadosos sobre la frecuencia con la que rastreamos los mismos dominios y respetando el Crawl-delay cuando sea apropiado.
- El rastreador de Anthropic respeta las señales de "no rastrear" honrando las directivas estándar de la industria en robots.txt, incluidas las prohibiciones para el Agente de Usuario <a href="https://commoncrawl.org/ccbot" rel="nofollow noopener noreferrer" target="_blank">CCBot de Common Crawl</a>.
- El rastreador de Anthropic respeta las tecnologías anti-elusión (por ejemplo, no intentaremos eludir los CAPTCHAs de los sitios que rastreamos).

Para limitar la actividad de rastreo, admitimos la extensión no estándar Crawl-delay para robots.txt. Un ejemplo de esto podría ser:

Para bloquear el rastreador de todo su sitio web, agregue esto al archivo robots.txt en su directorio de nivel superior. Haga esto para cada subdominio del que desee optar por no participar.

Optar por no ser rastreado por ClaudeBot requiere modificar el archivo robots.txt de la manera descrita anteriormente. Los métodos alternativos, como bloquear la(s) dirección(es) IP desde las que opera ClaudeBot, pueden no funcionar correctamente o garantizar persistentemente la exclusión, ya que esto impide nuestra capacidad de leer su archivo robots.txt. Además, actualmente no publicamos rangos de IP, ya que utilizamos IP públicas de proveedores de servicios. Esto puede cambiar en el futuro.

Puede obtener más información sobre nuestras prácticas y compromisos de manejo de datos en nuestro <a href="https://support.anthropic.com/en/collections/4078534-privacy-legal">Centro de Ayuda</a>. Si tiene más preguntas o cree que nuestro rastreador puede estar funcionando mal, comuníquese con <a href="mailto:claudebot@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">claudebot@anthropic.com</a>. Por favor, contáctenos desde un correo electrónico que incluya el dominio sobre el que nos está contactando, ya que de lo contrario es difícil verificar los informes.

¿Anthropic recopila datos de la web, y cómo pueden los propietarios de sitios bloquear el rastreador?

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.