1.5 Documents - Caricare e gestire i dati nell’AI

 

Caricare un documento

Per maggiori informazioni consulta la documentazione ufficiale.

Per caricare un documento procedi come indicato:
  • clicca sulla voce Workspace presente nel menu di sinistra;
  • nella sezione Workspace seleziona la voce Documents;
  • a destra dell'area di ricerca Search Documents clicca sul pulsante +;
  • si aprirà il livello Add Docs da cui è possibile selezionare un documento da caricare tramite il pulsante Click here to select documents;
  • contestualmente al caricamento del documento puoi assegnargli uno o più tag tramite la voce + Add Tags.

Tag

I tag servono per classificare i documenti caricati e poterli ricercare in fase di domanda scritta sulla chat.

Documents Settings

Saranno trattati solo i settaggi per le voci di maggior interesse, per le altre specifiche consulta la documentazione ufficiale.

Per poter settare i documenti caricati procedi come indicato:
  • clicca sulla voce Workspace presente nel menu di sinistra;
  • nella sezione Workspace seleziona la voce Documents;
  • clicca sul pulsante Documents Setting in alto a destra;
  • nella sezione Documents Setting potrai intervenire sulle seguenti voci:
    • General
      • General settings
        • Scan for documents from /data/docs
          Esegue la scansione dei documenti che sono presenti nella directory /data/docs.
        • Embedding Modal Engine
          Puoi modificare il motore di embadding, cioè il modello che crea le rappresentazioni vettoriali dei chunk, per poi salvarle in un database vettoriale.
        • Hybrid Search
      • Embedding Modal
      • Reset Vector Storage
        Puoi cancellare tutti i documenti presenti nello spazio /data/docs.
    • Chunk Params
      • Chunk Params
        • Chunk Size
          Ti permette di settare il numero massimo di token che vuoi per ogni singolo chunk.
        • Chunk Overlap
          Indica di quanti token i vari chunk si devono sovrapporre.
      • PDF Extract Images (OCR)
    • Query Params
      • Query Params
        • Top k
          Indica il numero dei documenti più rilevanti tra quelli analizzati.
      • PDF Extract Images (OCR)
        È il prompt, puoi modificarlo gestendo come comportarsi nelle varie casistiche.
    • Web Params
      • Web Loader Settings
        • Bypass SSL verification Websites
      • Youtube Loader Settings
        • Language


 
Quanto è stata utile questa guida?