Gh3275: sample_missing_splits in SST-2 · flairNLP/flair@909f1c2

Triggered via pull request August 9, 2023 09:47

alanakbik

synchronize #3276

GH3275-sample_missing_splits-in-corpus-subclasses

Status Failure

Total duration 29m 28s

Artifacts –

ci.yml

on: pull_request

test

29m 17s

Annotations

10 errors

test: flair/data.py#L341

ruff pytest_ruff.RuffError: flair/data.py:42:15: PYI024 Use `typing.NamedTuple` instead of `collections.namedtuple` | 42 | BoundingBox = namedtuple("BoundingBox", ["left", "top", "right", "bottom"]) | ^^^^^^^^^^ PYI024 | = help: Replace with `typing.NamedTuple` flair/data.py:730:14: E721 Do not compare types, use `isinstance()` | 728 | tokenizer = use_tokenizer 729 | 730 | elif type(use_tokenizer) == bool: | ^^^^^^^^^^^^^^^^^^^^^^^^^^^ E721 731 | tokenizer = SegtokTokenizer() if use_tokenizer else SpaceTokenizer() | flair/data.py:812:12: E721 Do not compare types, use `isinstance()` | 810 | assert token.sentence is None 811 | 812 | if type(token) is str: | ^^^^^^^^^^^^^^^^^^ E721 813 | token = Token(token) 814 | token = cast(Token, token) |

test: flair/tokenization.py#L1

Black format check --- /home/runner/work/flair/flair/flair/tokenization.py 2023-08-09 09:47:41.291888 +0000 +++ /home/runner/work/flair/flair/flair/tokenization.py 2023-08-09 09:53:47.235342 +0000 @@ -254,13 +254,13 @@ r"x", # added this special x character to tokenize it separately r"[\(\)\[\]\{\}]", # want to split at every bracket r"/", # want to split at every slash r"(?<=[0-9])[+\-\*^](?=[0-9-])", rf"(?<=[{char_classes.ALPHA_LOWER}])\.(?=[{char_classes.ALPHA_UPPER}])", - fr"(?<=[{char_classes.ALPHA}]),(?=[{char_classes.ALPHA}])", - fr'(?<=[{char_classes.ALPHA}])[?";:=,.]*(?:{char_classes.HYPHENS})(?=[{char_classes.ALPHA}])', - fr"(?<=[{char_classes.ALPHA}0-9])[:<>=/](?=[{char_classes.ALPHA}])", + rf"(?<=[{char_classes.ALPHA}]),(?=[{char_classes.ALPHA}])", + rf'(?<=[{char_classes.ALPHA}])[?";:=,.]*(?:{char_classes.HYPHENS})(?=[{char_classes.ALPHA}])', + rf"(?<=[{char_classes.ALPHA}0-9])[:<>=/](?=[{char_classes.ALPHA}])", ] ) prefix_re = spacy.util.compile_prefix_regex(combined_rule_prefixes()) infix_re = spacy.util.compile_infix_regex(infixes)

test: flair/training_utils.py#L341

ruff pytest_ruff.RuffError: flair/training_utils.py:102:12: E721 Do not compare types, use `isinstance()` | 100 | class WeightExtractor: 101 | def __init__(self, directory: Union[str, Path], number_of_weights: int = 10) -> None: 102 | if type(directory) is str: | ^^^^^^^^^^^^^^^^^^^^^^ E721 103 | directory = Path(directory) 104 | self.weights_file = init_output_file(directory, "weights.txt") |

test: flair/datasets/base.py#L341

ruff pytest_ruff.RuffError: flair/datasets/base.py:232:8: E721 Do not compare types, use `isinstance()` | 231 | def find_train_dev_test_files(data_folder, dev_file, test_file, train_file, autofind_splits=True): 232 | if type(data_folder) == str: | ^^^^^^^^^^^^^^^^^^^^^^^^ E721 233 | data_folder: Path = Path(data_folder) |

test: flair/datasets/sequence_labeling.py#L341

test: flair/models/tars_model.py#L341

ruff pytest_ruff.RuffError: flair/models/tars_model.py:198:16: E721 Do not compare types, use `isinstance()` | 196 | if isinstance(label_dictionary, Dictionary): 197 | label_dictionary = label_dictionary.get_items() 198 | if type(label_dictionary) == str: | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ E721 199 | label_dictionary = [label_dictionary] |

test: flair/trainers/language_model_trainer.py#L341

ruff pytest_ruff.RuffError: flair/trainers/language_model_trainer.py:59:12: E721 Do not compare types, use `isinstance()` | 57 | def __getitem__(self, index=0) -> torch.Tensor: 58 | """Tokenizes a text file on character basis.""" 59 | if type(self.files[index]) is str: | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ E721 60 | self.files[index] = Path(self.files[index]) 61 | assert self.files[index].exists() | flair/trainers/language_model_trainer.py:447:12: E721 Do not compare types, use `isinstance()` | 445 | optimizer: Type[Optimizer] = SGD, 446 | ): 447 | if type(checkpoint_file) is str: | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^ E721 448 | checkpoint_file = Path(checkpoint_file) |

test: flair/trainers/trainer.py#L341

test: flair/visual/training_curves.py#L341

test: tests/model_test_utils.py#L341

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Gh3275: sample_missing_splits in SST-2 #1940

Summary

Gh3275: sample_missing_splits in SST-2 #1940

Jobs

Run details

ci.yml

Annotations