深度学习、传统呆板学习和卷积神经网络中的Transformer、scikit-learn和Tex - IT评测·应用市场-qidao123.com技术社区

import torch
import torch.nn as nn
from transformers import BertTokenizer, BertModel
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.base import BaseEstimator, TransformerMixin
# Step 1: Transformer Feature Extractor
class BertFeatureExtractor(BaseEstimator, TransformerMixin):
def __init__(self, model_name='bert-base-uncased'):
self.tokenizer = BertTokenizer.from_pretrained(model_name)
self.model = BertModel.from_pretrained(model_name)
def fit(self, X, y=None):
return self
def transform(self, X):
inputs = self.tokenizer(X, return_tensors="pt", padding=True, truncation=True)
with torch.no_grad():
outputs = self.model(**inputs)
features = outputs.last_hidden_state[:, 0, :].numpy() # [CLS] token 表示
return features
# Step 2: TextCNN Model
class TextCNN(nn.Module):
def __init__(self, input_dim, num_classes=2):
super(TextCNN, self).__init__()
self.conv1 = nn.Conv1d(input_dim, 128, kernel_size=3, padding=1)
self.conv2 = nn.Conv1d(128, 64, kernel_size=3, padding=1)
self.fc = nn.Linear(64, num_classes)
def forward(self, x):
x = torch.relu(self.conv1(x))
x = torch.relu(self.conv2(x))
x = torch.max_pool1d(x, x.size(2)).squeeze(2)
x = self.fc(x)
return x
# Step 3: Combine Transformer and TextCNN
class TransformerTextCNN(BaseEstimator, TransformerMixin):
def __init__(self, transformer_extractor, cnn_model):
self.transformer_extractor = transformer_extractor
self.cnn_model = cnn_model
def fit(self, X, y):
# Extract features using Transformer
features = self.transformer_extractor.transform(X)
# Convert features to PyTorch tensor
features_tensor = torch.tensor(features).float()
# Train CNN model
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(self.cnn_model.parameters(), lr=0.001)
for epoch in range(5): # Simple training loop
self.cnn_model.train()
optimizer.zero_grad()
outputs = self.cnn_model(features_tensor.permute(0, 2, 1)) # Adjust dimensions
loss = criterion(outputs, torch.tensor(y))
loss.backward()
optimizer.step()
return self
def predict(self, X):
self.cnn_model.eval()
features = self.transformer_extractor.transform(X)
features_tensor = torch.tensor(features).float()
with torch.no_grad():
outputs = self.cnn_model(features_tensor.permute(0, 2, 1))
_, predicted = torch.max(outputs, 1)
return predicted.numpy()
# Step 4: Use scikit-learn Pipeline
pipeline = Pipeline([
('transformer_textcnn', TransformerTextCNN(
transformer_extractor=BertFeatureExtractor(),
cnn_model=TextCNN(input_dim=768)
)),
('classifier', LogisticRegression()) # Optional: Add a traditional classifier
])
# Example data
texts = ["I love programming", "Machine learning is fun"]
labels = [1, 0]
# Train the pipeline
pipeline.fit(texts, labels)
# Predict
predictions = pipeline.predict(texts)
print(predictions)

复制代码