Define a custom type for the results

import numpy as np from numba import jit, gdb_init import re

Define a custom type for the results

import pandas as pd import numpy as np import numba df=pd.read_csv('/kaggle/input/narrative/your_data.csv') df=df.head(10) #text=np.array(df['Narrative'],dtype=np.object_) text=np.array(df['Narrative'], dtype='S1000')

result_dtype = np.dtype([('keyword', 'S50'), ('matches', 'S50', (10,))])

@jit(nopython=False,debug=True) def find_pattern(text, keywords, pattern): text = text.lower() results = np.empty(len(keywords), dtype=result_dtype) result_idx = 0 for keyword in keywords: start_pos = 0 while True: keyword_pos = text.find(keyword, start_pos) if keyword_pos == -1: break # Start searching after the keyword start_search_pos = keyword_pos + len(keyword) subsequent_text = text[start_search_pos:start_search_pos + 50] matches = re.findall(pattern, subsequent_text) if matches: results[result_idx]['keyword'] = keyword results[result_idx]['matches'][:len(matches[:10])] = matches[:10] result_idx += 1 start_pos = keyword_pos + 1 # Move start_pos ahead to continue searching the text return results[:result_idx]

@jit(nopython=False,debug=True) def find_patterns_after_keywords(data, keywords, pattern): gdb_init() results = np.empty(len(data), dtype=result_dtype)

for idx in range(len(data)):
    text = str(data[idx])
    text = re.sub(r'[^\x00-\x7F]+', '', text)
    result = find_pattern(text, keywords, pattern)
    results[idx] = result
return results

pattern = r'\b\w+\s*/\s*\w+\b'

results = find_patterns_after_keywords(text, keywords, pattern) print(results)

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Attention		Attention
Pytorch		Pytorch
Introduction+to+CUDA+Python+with+Numba.ipynb		Introduction+to+CUDA+Python+with+Numba.ipynb
README.md		README.md
Tensor Puzzles.ipynb		Tensor Puzzles.ipynb
corpus generation and feature creation.py		corpus generation and feature creation.py
edward.py		edward.py
edward2.py		edward2.py
flexible_range_including_purchase_pattern.py		flexible_range_including_purchase_pattern.py
from torch import nn.py		from torch import nn.py
from torch import nn2.py		from torch import nn2.py
immutable.JPG		immutable.JPG
kerassample.py		kerassample.py
mix simualtion.py		mix simualtion.py
network x gpu enabled.py		network x gpu enabled.py
network x.py		network x.py
nieghbour estiamtion and purchase estimation.py		nieghbour estiamtion and purchase estimation.py
numba purchase simulation userid purchase count.py		numba purchase simulation userid purchase count.py
numba purchase simulation userid time flexible introducing ratio of total over dayfromstart.py		numba purchase simulation userid time flexible introducing ratio of total over dayfromstart.py
numba purchase simulation userid time flexible purchasecount datefromstart.py		numba purchase simulation userid time flexible purchasecount datefromstart.py
numba purchase simulation userid tiwem to pass corrected flexible pramount.py		numba purchase simulation userid tiwem to pass corrected flexible pramount.py
numba purchase simulation userid.py		numba purchase simulation userid.py
numba purchase simulation.py		numba purchase simulation.py
numba training.py		numba training.py
output.csv		output.csv
output1.csv		output1.csv
output2.csv		output2.csv
purchase simulation.py		purchase simulation.py
readgraph.py		readgraph.py
simualtion_including_purchase_pattern.py		simualtion_including_purchase_pattern.py
tensor.csv		tensor.csv
untitled0.py		untitled0.py
untitled1.py		untitled1.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Define a custom type for the results

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Define a custom type for the results

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages