#240 Hace mucho que no toco nada de esto, pero uno de los principios fundamentales de estas cosas es que este tipo de algoritmos funciona mal cuando usas elementos fuera del conjunto de entrenamiento (por ejemplo, el rango de x es [0,10] y estás probando con 33). Quizás sea eso por lo que no logra clasificar ese ejemplo.
Luego también (y aquí sigo hablando de memoria) en un clasificador que emplee una función sigmoide, los resultados van a estar entre (0,1) y la manera de seleccionar si la clase va a ser 0 o 1 es establecer un límite (por ejemplo, todo número mayor o igual a 0.5 será 1 y si no será 0). Ese límite es también algo que puedes variar y optimizar.
Todo esto son un poco notas a vuelapluma sin revisar literatura ni nada, pero espero que te haya podido ayudar