Nhảy tới nội dung

NodeParser

Tài liệu này đã được dịch tự động và có thể chứa lỗi. Đừng ngần ngại mở một Pull Request để đề xuất thay đổi.

NodeParser trong LlamaIndex có trách nhiệm chia các đối tượng Document thành các đối tượng Node dễ quản lý hơn. Khi bạn gọi .fromDocuments(), NodeParser từ ServiceContext được sử dụng để tự động thực hiện điều này cho bạn. Hoặc bạn cũng có thể sử dụng nó để chia tài liệu trước.

import { Document, SimpleNodeParser } from "llamaindex";

const nodeParser = new SimpleNodeParser();
const nodes = nodeParser.getNodesFromDocuments([
new Document({ text: "Tôi 10 tuổi. John 20 tuổi." }),
]);

TextSplitter

Bộ chia văn bản cơ bản sẽ chia văn bản thành các câu. Nó cũng có thể được sử dụng như một module độc lập để chia văn bản thô.

import { SentenceSplitter } from "llamaindex";

const splitter = new SentenceSplitter({ chunkSize: 1 });

const textSplits = splitter.splitText("Xin chào thế giới");

Tài liệu API

"